如何保证所基于的数据具有高质量?

发布时间:2020.10.31来源:知乎浏览量:68次标签:数据治理

基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及时。不完全的数据,特别是不准确的数据,可能会带来更危险的决策。但是,所收集的数据来源多样,种类丰富,也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况。IBM 认为,高质量的数据具有以下四个特征:

完整性(Completeness): 要从所有可能的来源中关联相关的数据。

准确性(Accuracy): 数据必须是正确的、一致的,没有输入错误。

可用性(Availability): 数据必须在需要时可以获得。

时效性(Timeliness): 当下的数据必须可以获得。

为了提高数据的质量,可能需要多管齐下。

首先要制订数据治理政策,其次要开发和部署专门的工具来简化数据收集过程。美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式, 让质量保证过程自动化。

2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 改善业务和IT协调的关键

    改善业务和IT协调的关键

    促进业务和IT协调变得比以往任何时候都更加重要。……查看详情

    发布时间:2019.02.18来源:亿信华辰浏览量:70次

  • 数据治理(DG)

    数据治理(DG)

    数据治理(DG)是对企业中使用的数据的可用性,可用性,完整性和安全性的整体管理。健全的数据治理计划包括理事机构或理事会,一套明确的程序和……查看详情

    发布时间:2018.11.12来源:techtarget浏览量:85次

  • 数据治理运营:团队

    数据治理运营:团队

    这是关于数据治理运作的两部分系列的第二部分。“数据治理可操作性:差距”系列的第一部分讨论了需求是如何产生的,数据……查看详情

    发布时间:2018.12.27来源:亿信华辰浏览量:70次

  • 企业数据治理价值

    企业数据治理价值

    数据治理是根据数据治理政策,通过组织人员、流程和技术的相互协作,对数据从形态、内容和关系等层面进行规范管理,提升数据的服务能力,以实现数……查看详情

    发布时间:2019.09.30来源:CSDN浏览量:59次

  • 数据治理要处理好四个关系

    数据治理要处理好四个关系

    随着我国大数据战略的不断推进,各类生产生活行为都以数据的形式全景留痕,构建了一个与现实空间平行的“数据空间”,数据治理呼之欲出。要切实发……查看详情

    发布时间:2020.04.09来源:知乎浏览量:52次

  • 数据治理是任何自助分析和数据发现策略的重要组成部分

    数据治理是任何自助分析和数据发现策略的重要组成部分

    当越来越多的用户与越来越多的数据交互并可视化时,可靠的治理实践可以确保每个利益相关者都能获得他们所需的洞察力,同时完全保留数据源的及时性……查看详情

    发布时间:2019.01.17来源:数据治理浏览量:64次

  • 数据治理、共享交换、数据仓库、数据中心的关系

    数据治理、共享交换、数据仓库、数据中心的关系

    建数据中心离不开数据,以前设计数据库都是从事务性数据库考虑(做的都是业务系统,思维模式太固定了),没有从数据仓库的角度来统管分析。以下是……查看详情

    发布时间:2019.08.07来源:CSDN浏览量:93次

  • 数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外…………查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:84次

  • 企业数字化转型的五化建设

    企业数字化转型的五化建设

    企业数字化转型的五化建设利用新一代信息技术,构建业务数据的采集、传输、存储、处理、分析、可视化结果和反馈的闭环,打不同系统、不同技术、不……查看详情

    发布时间:2020.04.03来源:知乎浏览量:69次

  • 企业如何做好数据安全管理?

    企业如何做好数据安全管理?

    数据安全对企业生存发展举足轻重,数据资产的外泄、破坏都会导致无可挽回的经济损失和核心竞争力缺失。而绝大多数中小企业注重业务的快速发展,往……查看详情

    发布时间:2022.05.27来源:小亿浏览量:138次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议