如何保证所基于的数据具有高质量?

发布时间:2020.10.31来源:知乎浏览量:113次标签:数据治理

基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及时。不完全的数据,特别是不准确的数据,可能会带来更危险的决策。但是,所收集的数据来源多样,种类丰富,也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况。IBM 认为,高质量的数据具有以下四个特征:

完整性(Completeness): 要从所有可能的来源中关联相关的数据。

准确性(Accuracy): 数据必须是正确的、一致的,没有输入错误。

可用性(Availability): 数据必须在需要时可以获得。

时效性(Timeliness): 当下的数据必须可以获得。

为了提高数据的质量,可能需要多管齐下。

首先要制订数据治理政策,其次要开发和部署专门的工具来简化数据收集过程。美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式, 让质量保证过程自动化。

2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据质量对区块链的重要性

    数据质量对区块链的重要性

    区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数……查看详情

    发布时间:2019.02.20来源:亿信华辰浏览量:123次

  • 当下企业数据治理有哪些重要性?

    当下企业数据治理有哪些重要性?

    随着大数据相关技术的不断成熟,数据作为一种资产,得到了越来越多企业机构的重视,为了能够有效的利用数据资产,数据治理成了当下政府和企业重点……查看详情

    发布时间:2019.07.18来源:知乎浏览量:72次

  • 主数据管理对生产率改善、风险管理、成本降低等方面均有显著的好处

    主数据管理对生产率改善、风险管理、成本降低等方面均有显著的好处

    什么是MDM(Master Data Management)? 主数据管理是旨在创建和维护权威、可靠、可持续、准确、及时和安全的环境的……查看详情

    发布时间:2020.09.03来源:知乎浏览量:123次

  • 数据治理之道帮助企业完成数字化转型

    数据治理之道帮助企业完成数字化转型

    数据治理不能再只是面向数据部门了,需要成为面向全企业用户的工作环境,需要以全企业用户为中心,从给用户提供服务的角度,管理好数据的同时为用……查看详情

    发布时间:2020.06.28来源:知乎浏览量:116次

  • 以元数据为基础的数据治理策略

    以元数据为基础的数据治理策略

    数据是公司资产。为了更快地做出决策,用户必须信任它。数据治理打破了整个企业中不同系统的数据孤岛,并建立了一套流程,标准和策略,以使企业范……查看详情

    发布时间:2019.09.04来源:知乎浏览量:154次

  • 不是专业数据分析师的你,该如何科学地看待大数据呢?

    不是专业数据分析师的你,该如何科学地看待大数据呢?

    似乎很多创业人,都喜欢讲一些概念化的东西。例如前两年的互联网+,例如后来的大数据,又例如最近的区块链…………查看详情

    发布时间:2019.02.13来源:亿信华辰浏览量:80次

  • 数据治理的关键要求是什么?

    数据治理的关键要求是什么?

    这些功能中的每一项都可以实现受管理的环境 目录和数据字典元数据的组合为数据策略和使用的可审计性提供了完整的信息。它还包含血统和操纵。工作……查看详情

    发布时间:2019.03.20来源:亿信华辰浏览量:107次

  • 一文分享主数据治理

    一文分享主数据治理

    当前大多数公司都处于部门间,系统间不通的状态,即使通了也是有很多的不一致,很难达到统一标准,数出一孔,协作流畅的程度,在资源有限的情况下……查看详情

    发布时间:2022.06.15来源:互联网浏览量:212次

  • 数据清理的终极指南——亿信华辰

    数据清理的终极指南——亿信华辰

    我花了几个月的时间分析来自传感器、调查及日志等相关数据。无论我用多少图表,设计多么复杂的算法,结果总是会与预期不同。……查看详情

    发布时间:2019.03.20来源:数据清理浏览量:104次

  • 企业如何进行数据资产管理

    企业如何进行数据资产管理

    大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发……查看详情

    发布时间:2020.08.28来源:知乎浏览量:93次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议