如何保证所基于的数据具有高质量?

发布时间:2020.10.31来源:知乎浏览量:72次标签:数据治理

基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及时。不完全的数据,特别是不准确的数据,可能会带来更危险的决策。但是,所收集的数据来源多样,种类丰富,也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况。IBM 认为,高质量的数据具有以下四个特征:

完整性(Completeness): 要从所有可能的来源中关联相关的数据。

准确性(Accuracy): 数据必须是正确的、一致的,没有输入错误。

可用性(Availability): 数据必须在需要时可以获得。

时效性(Timeliness): 当下的数据必须可以获得。

为了提高数据的质量,可能需要多管齐下。

首先要制订数据治理政策,其次要开发和部署专门的工具来简化数据收集过程。美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式, 让质量保证过程自动化。

2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND ,经过摸索,发现制订数据治理政策非常有必要,即要定义数据是什么,如何使用这些数据,谁应该有权访问这些数据。其经验总结如下:

1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调,建立关于数据的共识。

2.如何确定谁能访问什么数据:正确的问题不是这个业务是否需要这个数据,而是获取这个数据是否会给大学带来风险,因为数据治理的目的是为了支持更广泛地使用数据,为了避免使用数据带来的风险,要加强对能够获得数据的人进行培训。当数据可能对大学造成重大伤害时,要有严格的限制。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理:清洁客户数据的注意事项

    数据治理:清洁客户数据的注意事项

    根据相关研究显示,超过50%的企业花在清理数据上的时间比实际使用时要多,确保数据质量对营销成功至关重要。……查看详情

    发布时间:2019.06.28来源:知乎浏览量:55次

  • 数据治理市场驱动因素和预测

    数据治理市场驱动因素和预测

    全球数据治理市场分散,主要参与者使用各种策略,如新产品发布,扩张,协议,合资企业,合作伙伴关系,收购等,以增加他们在这个市场的足迹,以便……查看详情

    发布时间:2019.07.11来源:知乎浏览量:71次

  • 提高企业数据质量能做些什么?

    提高企业数据质量能做些什么?

    如今,我们生活在数据时代,各种数字化正在实实在在的改变着企业的日常运营,我们的生活、工作、学习,现在都离不开数据,对于企业来说,数据就是……查看详情

    发布时间:2019.11.01来源:知乎浏览量:64次

  • 数据交换平台的功能结构设计与实现

    数据交换平台的功能结构设计与实现

    数据交换平台是数据中心与其它应用系统沟通的桥梁,是进行数据交换的枢纽站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按……查看详情

    发布时间:2020.08.06来源:知乎浏览量:123次

  • 深度思考:从BERT看大规模数据的无监督利用

    深度思考:从BERT看大规模数据的无监督利用

    在击败 11 个 NLP 任务的 State-of-the-art 结果之后,BERT 成为了 NLP 界新的里程碑, 同时打开了新的思……查看详情

    发布时间:2019.02.20来源:亿信华辰浏览量:124次

  • 为什么数据标准这么重要,三个小招教你实现

    为什么数据标准这么重要,三个小招教你实现

    评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单……查看详情

    发布时间:2020.07.17来源:CSDN浏览量:52次

  • 走向人工智能治理的趋势

    走向人工智能治理的趋势

    这是人工智能(AI)驱动的自动化和自动机器的时代。自我改进,自我复制,自主智能机器日益普及和迅速扩大的潜力刺激了网络空间,地球空间和空间……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:53次

  • 加强数据治理-浅析企业数据治理机制

    加强数据治理-浅析企业数据治理机制

    数据治理是对企业数据资产管理行使权力和控制的活动集合(规划、监控和执行),是建立企业数据管理制度、指导企业执行数据规划、数据环境建设、数……查看详情

    发布时间:2018.12.07来源:浏览量:88次

  • 数据治理是否灵活?

    数据治理是否灵活?

    许多组织现在认识到数据治理的必要性,但仍在努力寻找正确的方法来构建它。一个好的方法是——敏捷!……查看详情

    发布时间:2019.01.11来源:亿信华辰浏览量:66次

  • 数据治理的3W1H:治什么?谁来治?怎么治?选哪个?

    数据治理的3W1H:治什么?谁来治?怎么治?选哪个?

    数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁能根据什么信息,在什……查看详情

    发布时间:2021.04.23来源:浏览量:112次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议