数据治理标准:数据质量六大评价标准

发布时间:2022.03.10来源:小亿浏览量:1772次标签:数据治理

一、什么是数据质量与管理?

众所周知,大数据建设的目标是为了融合组织数据,增加组织的洞察力和竞争力,实现业务创新和产业升级。因此,数据是企业数字化转型的核心要素,而数据能发挥价值的大小取决于其数据的质量高低。

数据质量指在业务环境下,数据符合数据消费者的使用目的,满足业务场景具体的需求。数据质量包含两个方面:数据的过程质量和数据自身的质量。数据的过程质量就是数据的使用过程符合标准规范,比如数据存储:数据是否被安全的存储到了合适的介质上,能够保证数据不受外来因素的破坏。除此之外还包括获取、传输、应用和删除等数据生命周期的各个阶段。数据自身的质量指数据必须真实准确地反映实际发生的业务,任何业务操作的数据都没有被遗漏,数据存在各种约束条件,这种约束条件不能自相矛盾等等。

数据质量管理指对数据在每个阶段里可能引发的各类数据质量问题进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平确保数据质量的提升。数据质量管理是一个集方法论、管理、技术和业务为一体的解决方案,是一个不断循环的管理过程。一方面反映出数据质量的重要性以及数据质量工作的零散性和琐碎性;另一方面也反映出企业数据很难一次性就达到使用的标准规范,毕竟数据治理是一个相对漫长的过程。

1646894720(1).jpg

二、数据质量评价标准

完整性:完整性可以从数据集完整性,架构完整性,属性完整性三个层面来理解。其中,数据集完整性是指数据集中应该出现而没有出现的数据成员的程度;架构完整性是指数据架构的实体和属性没有缺失的程度;属性完整性是指一张表中的一列没有缺失的程度,或者对于无效属性的度量。

准确性:用于描述数据是否正确。通常准确性是个综合性指标,由多个二级指标组成,二级指标需要通过业务规则先将错误数据定义出来,进而进行计算。

规范性:指数据符合数据模型、数据标准、元数据、业务规则或权威参考数据的程度。在实践中,通常如果企业在制定相关标准规范的时候考虑了国标和行业惯例,并且在实际落地时也进行了良好的管控,则规范性大部分都可满足,不需要额外定量测量。

一致性:一致性也可以从形式一致性、参照一致性、元素一致性三个视角来看。形式一致性,通常不做必须检查的要求,根据实际业务需求来判断;参照一致性是与值域表中的值不匹配的行数;元素一致性是指如城市名字和邮政编码应该是一致的,输入邮编就能自动匹配正确对应的城市名字。

时效性:需要用到输入时间、发布时间、敏感性指数、年限、波动时长等指标。这类复杂指标通常在企业里不会计算,通常用数据年龄就足够了。

可访问性:衡量获取数据的难易程度,强调了时间的重要性。这个指标权衡了用户需要数据的时间和提供数据所需的时间。如果一个数据消费者需要近5天的数据,而获取它也需要五天的时间,那么大概率这个数据对这位数据消费者是无效的。

三、睿治数据质量管理平台的作用

亿信华辰睿治数据治理平台的数据质量管理模块以全面质量管理PDCA循环管理方法为指导,充分结合国内数据质量管理工作的特点,运用数据挖掘、元数据管理、工作流、数据分析、评分卡、可视化等技术最终帮助企业和政府建立数据质量管理体系,全面提升数据的规范性、完整性、一致性、及时性、逻辑性等,降低数据管理成本,减少因数据不可靠导致的决策偏差和损失。

1、发现数据质量问题

灵活定义多模型质检方案,多点监测、多模型质检方案,高效调度,并发和串行处理相结合,性能高效,只需2分30秒,便可完成20条规则百万级数据的质量检查。

2、构建数据质量规则库

定义数据验证方法,内嵌空值检查、值域检查等13种检查规则,基本覆盖目前数据质量相关问题。

3、数据质量全流程管理

提供从质量监控、标准定义、质量分析、绩效评估、重大问题及时告警、质量报告、流程整改发起、系统管理等数据质量管理全过程的功能,不仅能发现问题、还能将问题分发给数据负责人、管理者,在线跟踪问题处理进展。

4、出具全面的“体检报告”

内置常规质检分析报告,实时可视化呈现质检结果,质检结果模型灵活扩展,充分利用了BI工具的分析展现能力,提供图文并茂的质量检查结果报告。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理的定义:什么是数据治理?

    数据治理的定义:什么是数据治理?

    数据治理(DG)是增长最快的学科之一,但在定义数据治理方面,许多组织都在努力。 Dataversity称DG是“有助于确保组织内数据资……查看详情

    发布时间:2018.11.15来源:Zak Cole浏览量:153次

  • 数据治理管理干货 | 数据质量管理的方法

    数据治理管理干货 | 数据质量管理的方法

    原始数据通常包含错误,如果不做数据质量管理,可能会导致错误的结果。数据质量管理是数据治理中获得正确上下文和结论的基本步骤。……查看详情

    发布时间:2021.06.22来源:亿信数据治理知识库浏览量:150次

  • 安全合作伙伴共同为云和多云合规性增强数据治理和隐私

    安全合作伙伴共同为云和多云合规性增强数据治理和隐私

    企业可以限制这些风险 - 以及手动控制错误配置,云环境政策孤岛和云锁定的潜在风险……查看详情

    发布时间:2019.01.22来源:亿信华辰浏览量:115次

  • 多措并举提升银行业数据治理能力

    多措并举提升银行业数据治理能力

    数据治理是银行业高质量发展的必由之路,当前银行业的数字化转型面临一些挑战和不足,要从建立数据治理架构、统一数据标准、加强数据分析应用等方……查看详情

    发布时间:2019.12.13来源:知乎浏览量:115次

  • 数据治理到底应该怎么治?

    数据治理到底应该怎么治?

    数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点……查看详情

    发布时间:2020.07.07来源:知乎浏览量:126次

  • 数据治理准备的五大支柱:倡议赞助

    数据治理准备的五大支柱:倡议赞助

    “Facebook是全球数据治理的核心。”3月19日“华尔街日报”的一篇文章总结了我们所处的位置。在通用数据保护法规(GDPR)生效仅两……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:138次

  • 银行业重塑数据治理体系 助力转型升级

    银行业重塑数据治理体系 助力转型升级

    银行业金融机构要深化认识,积极主动对接国家政策,改革数据治理体系,依靠数据治理改进决策、缩减成本、降低风险、增强核心竞争力,推动银行业向……查看详情

    发布时间:2019.10.18来源:知乎浏览量:137次

  • 数据仓库应该怎么建立

    数据仓库应该怎么建立

    现在的社会就是一个数据化的社会,大数据已经成为大家讨论的热门话题了,对于每个企业来说,建立自己的数据仓库已经显得非常重要了,尤其是对于新……查看详情

    发布时间:2019.07.17来源:数据仓库小编浏览量:84次

  • 四说大数据时代“神话”:从大数据到深数据

    四说大数据时代“神话”:从大数据到深数据

    为国内最大的电商平台之一,苏宁每天要处理数量巨大的数据。为了更快速高效地处理这些数据,苏宁调度平台采取了哪些措施呢?……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:118次

  • 企业数据治理的目的、意义及挑战有哪些?

    企业数据治理的目的、意义及挑战有哪些?

    随着大数据相关技术的不断成熟,数据作为一种资产,得到了越来越多企业机构的重视,为了能够有效的利用数据资产,数据治理成了当下政府和企业重点……查看详情

    发布时间:2022.05.11来源:小亿浏览量:616次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议