如何保证所基于的数据具有高质量?

发布时间:2020.10.31来源:知乎浏览量:110次标签:数据治理

基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及时。不完全的数据,特别是不准确的数据,可能会带来更危险的决策。但是,所收集的数据来源多样,种类丰富,也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况。IBM 认为,高质量的数据具有以下四个特征:

完整性(Completeness): 要从所有可能的来源中关联相关的数据。

准确性(Accuracy): 数据必须是正确的、一致的,没有输入错误。

可用性(Availability): 数据必须在需要时可以获得。

时效性(Timeliness): 当下的数据必须可以获得。

为了提高数据的质量,可能需要多管齐下。

首先要制订数据治理政策,其次要开发和部署专门的工具来简化数据收集过程。美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式, 让质量保证过程自动化。

2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理与数据质量有何不同?

    数据治理与数据质量有何不同?

    当我们听到数据管理这些词时,“ 数据质量 ”和“数据治理” 这两个术语出现了很多,它们应该是因为这些是确保组织以最佳方式利用其信息的重要……查看详情

    发布时间:2019.06.25来源:知乎浏览量:176次

  • 数据治理准备的五大支柱:倡议赞助

    数据治理准备的五大支柱:倡议赞助

    “Facebook是全球数据治理的核心。”3月19日“华尔街日报”的一篇文章总结了我们所处的位置。在通用数据保护法规(GDPR)生效仅两……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:127次

  • 关于数据治理的十件事

    关于数据治理的十件事

    数据治理是我们现在遇到的众多热门词汇之一。有人可能会说这是炒作,但我不这么认为。出于许多好的理由,这是我们的首要考虑,其中一些我们在下面……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:141次

  • 数据标准在数据资产管理中的意义

    数据标准在数据资产管理中的意义

    尽管出现了很多专家和专著,但真正理解这个概念的人并不多,懂得如何实操数据资产管理、在企业中真正落地的更寥寥无几。笔者有幸参与了国内几个典……查看详情

    发布时间:2019.03.12来源:亿信华辰浏览量:132次

  • 数据治理之“术”金融业如何做好数据治理工作

    数据治理之“术”金融业如何做好数据治理工作

    数据治理之“术”金融业如何做好数据治理工作就如何做好数据治理工作,可参考以下四点意见。……查看详情

    发布时间:2019.12.12来源:知乎浏览量:108次

  • 建立统一的数据交换平台实现各部门的数据共享

    建立统一的数据交换平台实现各部门的数据共享

    要实现各部门的数据共享,必须先建立统一的数据交换平台,通过交换平台实现各异构数据库之间的数据集成,实现原有各业务系统在数据级集成,保证异……查看详情

    发布时间:2020.08.21来源:知乎浏览量:131次

  • 数据质量管理的方法论

    数据质量管理的方法论

    在数据治理方面,不论是国际的还是国内的,我们能找到很多数据治理成熟度评估模型这样的理论框架,作为企业实施的指引。而说到数据质量管理的方法……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:165次

  • 管理数据与拥有数据一样重要:关注数据治理和数据质量

    管理数据与拥有数据一样重要:关注数据治理和数据质量

    在许多人看来,数据 - 干净,清晰和准确的数据 - 统治着宇宙。然而,当数据质量较差时,企业及其客户都会受到影响。即使数据是原始数据,糟……查看详情

    发布时间:2019.09.20来源:知乎浏览量:152次

  • 数据治理:将数据从源头进行清洗

    数据治理:将数据从源头进行清洗

    数据一切都与技术的集中化有关。数据安全地存储在企业大型机上,只有具备导航预处理数据库技能的程序员才能访问它。差不多四十年后,所有这些都与……查看详情

    发布时间:2019.06.20来源:简书浏览量:143次

  • 数据治理需要关注什么?

    数据治理需要关注什么?

    确保企业数据的质量,可用性,可集成性,安全性和易用性。数据是公司的资产,组织必须从中获取业务价值,最大程度地降低风险并寻求方法进一步开发……查看详情

    发布时间:2020.10.31来源:知乎浏览量:197次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议