数据治理标准:数据质量六大评价标准

发布时间:2022.03.10来源:小亿浏览量:1307次标签:数据治理

一、什么是数据质量与管理?

众所周知,大数据建设的目标是为了融合组织数据,增加组织的洞察力和竞争力,实现业务创新和产业升级。因此,数据是企业数字化转型的核心要素,而数据能发挥价值的大小取决于其数据的质量高低。

数据质量指在业务环境下,数据符合数据消费者的使用目的,满足业务场景具体的需求。数据质量包含两个方面:数据的过程质量和数据自身的质量。数据的过程质量就是数据的使用过程符合标准规范,比如数据存储:数据是否被安全的存储到了合适的介质上,能够保证数据不受外来因素的破坏。除此之外还包括获取、传输、应用和删除等数据生命周期的各个阶段。数据自身的质量指数据必须真实准确地反映实际发生的业务,任何业务操作的数据都没有被遗漏,数据存在各种约束条件,这种约束条件不能自相矛盾等等。

数据质量管理指对数据在每个阶段里可能引发的各类数据质量问题进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平确保数据质量的提升。数据质量管理是一个集方法论、管理、技术和业务为一体的解决方案,是一个不断循环的管理过程。一方面反映出数据质量的重要性以及数据质量工作的零散性和琐碎性;另一方面也反映出企业数据很难一次性就达到使用的标准规范,毕竟数据治理是一个相对漫长的过程。

1646894720(1).jpg

二、数据质量评价标准

完整性:完整性可以从数据集完整性,架构完整性,属性完整性三个层面来理解。其中,数据集完整性是指数据集中应该出现而没有出现的数据成员的程度;架构完整性是指数据架构的实体和属性没有缺失的程度;属性完整性是指一张表中的一列没有缺失的程度,或者对于无效属性的度量。

准确性:用于描述数据是否正确。通常准确性是个综合性指标,由多个二级指标组成,二级指标需要通过业务规则先将错误数据定义出来,进而进行计算。

规范性:指数据符合数据模型、数据标准、元数据、业务规则或权威参考数据的程度。在实践中,通常如果企业在制定相关标准规范的时候考虑了国标和行业惯例,并且在实际落地时也进行了良好的管控,则规范性大部分都可满足,不需要额外定量测量。

一致性:一致性也可以从形式一致性、参照一致性、元素一致性三个视角来看。形式一致性,通常不做必须检查的要求,根据实际业务需求来判断;参照一致性是与值域表中的值不匹配的行数;元素一致性是指如城市名字和邮政编码应该是一致的,输入邮编就能自动匹配正确对应的城市名字。

时效性:需要用到输入时间、发布时间、敏感性指数、年限、波动时长等指标。这类复杂指标通常在企业里不会计算,通常用数据年龄就足够了。

可访问性:衡量获取数据的难易程度,强调了时间的重要性。这个指标权衡了用户需要数据的时间和提供数据所需的时间。如果一个数据消费者需要近5天的数据,而获取它也需要五天的时间,那么大概率这个数据对这位数据消费者是无效的。

三、睿治数据质量管理平台的作用

亿信华辰睿治数据治理平台的数据质量管理模块以全面质量管理PDCA循环管理方法为指导,充分结合国内数据质量管理工作的特点,运用数据挖掘、元数据管理、工作流、数据分析、评分卡、可视化等技术最终帮助企业和政府建立数据质量管理体系,全面提升数据的规范性、完整性、一致性、及时性、逻辑性等,降低数据管理成本,减少因数据不可靠导致的决策偏差和损失。

1、发现数据质量问题

灵活定义多模型质检方案,多点监测、多模型质检方案,高效调度,并发和串行处理相结合,性能高效,只需2分30秒,便可完成20条规则百万级数据的质量检查。

2、构建数据质量规则库

定义数据验证方法,内嵌空值检查、值域检查等13种检查规则,基本覆盖目前数据质量相关问题。

3、数据质量全流程管理

提供从质量监控、标准定义、质量分析、绩效评估、重大问题及时告警、质量报告、流程整改发起、系统管理等数据质量管理全过程的功能,不仅能发现问题、还能将问题分发给数据负责人、管理者,在线跟踪问题处理进展。

4、出具全面的“体检报告”

内置常规质检分析报告,实时可视化呈现质检结果,质检结果模型灵活扩展,充分利用了BI工具的分析展现能力,提供图文并茂的质量检查结果报告。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 走向人工智能治理的趋势

    走向人工智能治理的趋势

    这是人工智能(AI)驱动的自动化和自动机器的时代。自我改进,自我复制,自主智能机器日益普及和迅速扩大的潜力刺激了网络空间,地球空间和空间……查看详情

    发布时间:2019.03.06来源:亿信华辰浏览量:74次

  • 国内数据治理系统全面介绍

    国内数据治理系统全面介绍

    随着大数据技术的飞速发展,大数据已经融入到了各行各业,为了能让各企业的数据资产得到充分的利用,数据治理非常重要,如今数据治理已经逐渐成为……查看详情

    发布时间:2019.09.19来源:知乎浏览量:83次

  • 如今数据治理与企业密切相关

    如今数据治理与企业密切相关

    随着越来越多的企业建立并广泛应用BI系统,数据治理的话题也在最近被越来越多地提及和讨论。有专家表示,只有建立了一定的数据治理体系,用户……查看详情

    发布时间:2019.01.08来源:亿信华辰浏览量:70次

  • 大数据时代,我们将面临数据治理的新阶段

    大数据时代,我们将面临数据治理的新阶段

    目前业界并没有对其概念的统一标准定义,我们可以这么认为,数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利……查看详情

    发布时间:2020.03.26来源:知乎浏览量:64次

  • 在数字时代管理数据

    在数字时代管理数据

    人类生活在数据时代。今天生成的数据比人类历史上5000年的数据还要多 - 每天大约有2.5亿个字节的数据。……查看详情

    发布时间:2019.04.04来源:亿信华辰浏览量:79次

  • 数据治理的坑你遇到过几个?

    数据治理的坑你遇到过几个?

    数据治理是一项长期而繁杂的工作,很多时候大家都为如何做好数据治理而感到困惑,甚至很多时候对此失去了信心。……查看详情

    发布时间:2019.08.19来源:御数坊浏览量:80次

  • 为什么数据治理是改善决策的关键

    为什么数据治理是改善决策的关键

    能够快速收集大量数据,分析数据,然后使用您学到的知识来帮助促进更好的决策,这是许多企业高管的梦想。但是就像任何可以在一个句子中总结的事物……查看详情

    发布时间:2019.01.22来源:亿信华辰浏览量:129次

  • 数据治理是任何自助分析和数据发现策略的重要组成部分

    数据治理是任何自助分析和数据发现策略的重要组成部分

    当越来越多的用户与越来越多的数据交互并可视化时,可靠的治理实践可以确保每个利益相关者都能获得他们所需的洞察力,同时完全保留数据源的及时性……查看详情

    发布时间:2019.01.17来源:数据治理浏览量:72次

  • 世界各地的组织如何处理数据治理

    世界各地的组织如何处理数据治理

    在2019年G20大阪峰会召开的同时,我很幸运能够在整个六月的整个月里在东京办公室工作。这是一个有趣的事件,引起我注意的主要议题之一是“……查看详情

    发布时间:2019.07.11来源:知乎浏览量:76次

  • 定义DG:数据治理可以为您做什么?

    定义DG:数据治理可以为您做什么?

    由于数据驱动的业务,数据治理(DG)变得越来越普遍,但是对于许多组织来说,定义DG并进行合理的实践仍然很困难。……查看详情

    发布时间:2019.01.21来源:亿信华辰浏览量:89次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议