数据质量监控

发布时间:2019.12.06来源:知乎浏览量:239次标签:数据治理

数据质量监控可以分为数据质量的事前预防控制、事中过程控制和事后监督控制:


事前预防控制
建立数据标准化模型,对每个数据元素的业务描述、数据结构、业务规则、质量规则、管理规则、采集规则进行清晰的定义,以上的数据质量的校验规则、采集规则本身也是一种数据,在元数据中定义。面对庞大的数据种类和结构,如果没有元数据来描述这些数据,使用者无法准确地获取所需信息。正是通过元数据,使得数据才可以被理解、使用,才会产生价值。构建数据分类和编码体系,形成企业数据资源目录,让用户能够轻松地查找和定位到相关的数据。实践告诉我们做好元数据管理,是预防数据质量问题的基础。

数据质量问题的预防控制最有效的方法就是找出发生数据质量问题的根本原因并采取相关的策略进行解决。
1)确定根本原因:确定引起数据质量问题的相关因素,并区分它们的优先次序,以及为解决这些问题形成具体的建议。

2)制定和实施改进方案:最终确定关于行动的具体建议和措施,基于这些建议制定并且执行提高方案,预防未来数据质量问题的发生。


事中过程控制
事中数据质量的控制,即在数据的维护和使用过程中去监控和处理数据质量。通过建立数据质量的流程化控制体系,对数据的新建、变更、采集、加工、装载、应用等各个环节进行流程化控制。数据质量的过程控制,要做好两个强化:
(1)强化数据的标准化生产,从数据的源头控制好数据质量,该过程可以采用系统自动化校验和人工干预审核相结合的方式进行管理,数据的新增和变更一方面通过系统进行数据校验,对于不符合质量规则的数据不允许保持,另一方面采集流程驱动的数据管理模式,数据的新增和变更操作都需要人工进行审核,只有审核通过才能生效。
(2)强化数据质量预警机制,对于数据质量边界模糊的数据采用数据质量预警机制。数据预警机制是对数据相似性和数据关联性指标的重要控制方法。针对待管理的数据元素,配置数据相似性算法或数据关联性算法,在数据新增、变更、处理、应用等环节调用预置的数据质量算法,进行相识度或关联性分析,并给出数据分析的结果。数据预警机制常用在业务活动的交易风险控制等场景。

事后监督控制
是不是我们最好了事前预防控制和事中过程控制,就不会再有数据质量问题的发生了?答案显然是否定的。而事实上,不论我们做了多少预防措施、多严格的过程控制,总是还有数据质量问题的“漏网之鱼”,你会发现只要是人为干预的过程,总会存在数据质量的问题。数据质量问题一旦产生就已经是“木已成舟”,为了避免或减低其对业务的影响,我们需要及时的发现它。这里,数据质量的事后监督控制就尤为重要了。

定期开展数据质量的检查和清洗工作应作为企业数据质量治理的常态工作来抓。
1)设置数据质量规则。基于数据的元模型配置数据质量规则,即针对不同的数据对象,配置相应的数据质量指标,不限于:数据唯一性、数据准确性、数据完整性、数据一致性、数据关联性、数据及时性等。
2)设置数据检查任务。设置成手动执行或定期自动执行的系统任务,通过执行检查任务对存量数据进行检查,形成数据质量问题清单。
3)出具数据质量问题报告。根据数据质量问题清单汇总形成数据质量报告,数据质量报告支持查询、下载等操作。
4)制定和实施数据质量改进方案,进行数据质量问题的处理。
5)评估与考核。通过定期对系统开展全面的数据质量状况评估,从问题率、解决率、解决时效等方面建立评价指标进行整改评估,根据整改优化结果,进行适当的绩效考核。

数据治理的“常态化”才是数据质量问题的最好解决方式,而要实现常态化治理就需要改变原来的企业组织形式、管理流程、转变观念,以适应这种变化。数据治理的“常态化”要经得起折腾,所以千万不能老做些重新发明轮子的亊情!

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 浅析数据治理与数据安全治理的概念差异

    浅析数据治理与数据安全治理的概念差异

    当我们谈到数据资产的时候,想到最多的就是数据治理,接下来就是数据安全治理,那么这两者之间有什么区别和差异呢?……查看详情

    发布时间:2019.08.14来源:知乎浏览量:251次

  • 从信息安全角度看大数据管理风险

    从信息安全角度看大数据管理风险

    无论是从企业存储策略与环境来看,还是从数据与存储操作的角度来看,大数据带来的“管理风险”不仅日益突出,而且如果不能妥善解决,将肯定会造成……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:238次

  • 数据治理:它是什么以及它为什么重要?

    数据治理:它是什么以及它为什么重要?

    数据治理:它是什么以及它为什么重要?……查看详情

    发布时间:2018.12.26来源:亿信华辰浏览量:145次

  • 元数据管理101:什么,为什么以及如何

    元数据管理101:什么,为什么以及如何

    元数据管理已逐渐成为成功的数字化计划战略的最重要实践之一。随着大数据和云等分布式体系结构的兴起,可以创建孤立的系统和数据,元数据管理对于……查看详情

    发布时间:2018.12.19来源:数据治理浏览量:148次

  • 大数据治理需要具备哪些能力和关键技术

    大数据治理需要具备哪些能力和关键技术

    从企业的数据资产管理和提升数据质量等的数据应用上,大数据治理的内容在不断地发展和完善,在其落地实施的过程中面临着巨大的挑战。我们现在通过……查看详情

    发布时间:2019.08.13来源:知乎浏览量:157次

  • 数据都成为生产要素了?数据该如何治理?

    数据都成为生产要素了?数据该如何治理?

    先说说数据,其实现在说的数据和过去说的数据相比差别非常大,现在所说的数据不是一个静态文档,它是流动的数据,碎片化的数据,以各种各样的形式……查看详情

    发布时间:2020.11.23来源:知乎浏览量:287次

  • 现在企业为什么越来越关注数据治理了

    现在企业为什么越来越关注数据治理了

    数据治理在当今的企业中经常被引用,但是许多IT团队在围绕如此宽泛的概念进行思考时遇到了麻烦。数据治理也称为信息治理,是指用于管理整个组织……查看详情

    发布时间:2020.06.22来源:知乎浏览量:194次

  • 为什么集成和治理对数据湖成功至关重要

    为什么集成和治理对数据湖成功至关重要

    这是一个由三部分组成的系列文章的最后一篇文章,探讨如何构建一个能够满足真正企业级数据管理平台所有要求的数据湖。虽然早期的专题文章侧重于H……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:133次

  • 数据标准管理平台解决方案

    数据标准管理平台解决方案

    企业内部开展企业数据资源整合工作,实现对企业核心业务、核心资源的综合管控,是企业信息化的一个核心目标。通过体系化的数据资源管理平台的建设……查看详情

    发布时间:2020.04.28来源:知乎浏览量:208次

  • 谈谈数据治理是什么?

    谈谈数据治理是什么?

    数据治理这项工作一直都是存在的,和数据库设计的三范式一样都是为了数据的管理。数据治理是一整套完整的组织、制度、技术管理行为。……查看详情

    发布时间:2021.03.06来源:人人都是产品经理浏览量:170次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议