如何保证所基于的数据具有高质量?

发布时间:2020.10.31来源:知乎浏览量:132次标签:数据治理

基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及时。不完全的数据,特别是不准确的数据,可能会带来更危险的决策。但是,所收集的数据来源多样,种类丰富,也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况。IBM 认为,高质量的数据具有以下四个特征:

完整性(Completeness): 要从所有可能的来源中关联相关的数据。

准确性(Accuracy): 数据必须是正确的、一致的,没有输入错误。

可用性(Availability): 数据必须在需要时可以获得。

时效性(Timeliness): 当下的数据必须可以获得。

为了提高数据的质量,可能需要多管齐下。

首先要制订数据治理政策,其次要开发和部署专门的工具来简化数据收集过程。美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式, 让质量保证过程自动化。

2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 元数据管理在数据仓库中的应用

    元数据管理在数据仓库中的应用

    随着业务系统每年收集和使用的数据飞速增长,数据体量日趋增长,数据形态多样化且不统一,多种数据源之间的采集、传播和共享遇到困难。元数据管理……查看详情

    发布时间:2022.05.06来源:小亿浏览量:228次

  • 如何确定数据治理工具与数据中心及信息系统的关系

    如何确定数据治理工具与数据中心及信息系统的关系

    通过实施数据治理工具,可以让数据质量变得更好,发掘数据资产的商业价值,实现如下目标:对业务的支撑;降低经营风险、安全保障;对决策进行支持……查看详情

    发布时间:2021.04.30来源:亿信数据治理知识库浏览量:185次

  • 数据质量稳定提升方法:使用反馈循环

    数据质量稳定提升方法:使用反馈循环

    每个额外的数据源都给流程增加了更多的复杂性,并且至少在短期内,在流程自动化之前消耗了额外的时间。现在是时候这些数据专业人员可以专门回答业……查看详情

    发布时间:2021.04.23来源:亿信数据治理知识库浏览量:200次

  • 客户数据中台CDP是什么?真的能构建用户全景画像,消除数据孤岛吗?

    客户数据中台CDP是什么?真的能构建用户全景画像,消除数据孤岛吗?

    现代营销依赖于数据。所有人都想从最基本的开始做起,了解客户是谁。这似乎很简单,但客户与业务互动渠道的激增,使这个简单的目标变得极其复杂。……查看详情

    发布时间:2021.07.16来源:亿信数据治理知识库浏览量:257次

  • 2019年专注于稳健数据治理的合规性,质量和定制

    2019年专注于稳健数据治理的合规性,质量和定制

    数据治理,组织内数据的正确和有组织的管理,仍然是2019年的一个焦点。对于希望充分利用其数据的组织,他们必须建立系统以确保数据的正确性,……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:110次

  • 数据质量管理的方法论

    数据质量管理的方法论

    在数据治理方面,不论是国际的还是国内的,我们能找到很多数据治理成熟度评估模型这样的理论框架,作为企业实施的指引。而说到数据质量管理的方法……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:212次

  • 数栈:为数据治理而生

    数栈:为数据治理而生

    2018年5月21日,中国银保监会印发《银行业金融机构数据治理指引的通知》(银保监发〔2018〕22号),新规从征求意见到正式稿落地仅仅……查看详情

    发布时间:2019.01.04来源:NinGoo浏览量:190次

  • 如何正确理解数据治理

    如何正确理解数据治理

    我们经常会谈到关于大数据、数据质量、主数据、元数据方面的一些问题,不可避免的会提到数据治理,那么什么是数据治理呢?……查看详情

    发布时间:2020.07.15来源:知乎浏览量:144次

  • 一个通用的数据中台架构应该如何构建,本文告诉你答案

    一个通用的数据中台架构应该如何构建,本文告诉你答案

    这两年,越来越多的大数据从业者提到“数据中台”的概念。在信息系统建设工作中,我们熟知系统可以分为前台和后台,但什么是中台,每个人的理解并……查看详情

    发布时间:2020.09.14来源:小亿浏览量:136次

  • 数据质量管理包括什么方面

    数据质量管理包括什么方面

    数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情

    发布时间:2019.11.07来源:知乎浏览量:274次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议