数据治理知识:怎么判断数据质量是否健康?

发布时间:2021.06.10来源:亿信华辰数据治理知识库浏览量:43次标签:数据治理

世界各地的组织比以往任何时候都更依赖数据。但是,每天被数据包围和使用数据来做出日常业务决策是有区别的。实现基本业务目标的唯一方法是根据高质量、可信的数据(健康数据)采取行动。但我们生活在大数据时代,一个组织管理的数据越多,保持这些数据的健康就越困难。  

大多数人凭直觉就知道,健康的数据应该是干净、完整的,并且符合法律和监管要求。不幸的是,仅凭这些因素并不能保证数据已准备好用于业务决策。大多数组织无法衡量其数据的健康程度——依赖无法衡量健康状况的数据是愚蠢的。部分问题在于,虽然人们认为他们了解数据健康意味着什么,但他们很难定义或评估数据质量是否健康

<a href=数据治理知识.jpg" width="565" height="303" style="width: 565px; height: 303px;"/>

让我们从数据健康的明确定义开始。  

数据质量健康定义

数据质量健康是衡量数据决策准备情况的指标。要了解您组织的数据是否健康,您必须能够证明其有效、完整且具有足够的质量,以生成决策者可以放心依赖于业务决策的分析。  

亿信华辰的数据健康愿景是一个技术和行为系统协同工作,以确保可信、可靠数据的自由流动。健康数据意味着组织中的每个人都可以在需要时访问他们需要的信息,并在不怀疑其有效性的情况下使用它。 

与任何医疗保健系统一样,数据健康涉及整个生命周期的监控和干预。我们在预防、治疗和社区支持的框架中考虑数据健康: 

· 预防性护理:先发制人地识别数据挑战

· 有效的处理方法:系统地解决数据可靠性问题和风险  

· 支持性文化:建立协作数据管理学科 

通过数据健康指标来证明数据的业务价值,组织几乎可以改进其运营的任何方面:

· 增强销售和营销分析  

· 解决数据治理和合规性问题  

· 改进业务流程  

· 转变客户体验

· 推动 360 度参与  

· 启用机器学习和人工智能  

如果没有健康的数据,所有这些过程都会出错。如果您工作所依据的可用数据不准确、不受控制或过时,您就无法找到合适的客户、缩短销售周期或改进流程。不健康的数据会耗费公司决策的时间和质量,从而增加成本并对收入产生负面影响。随着您扩展到使用大数据,数据的健康变得越来越重要。对于使用大数据的公司来说,制定健康指标至关重要。

那么如何判断数据是否健康呢?

衡量数据健康状况

数据质量是数据健康的主要考虑因素。英国 数据管理协会定义了衡量数据质量的六个维度: 

· 准确性- 数据正确描述所描述的现实世界对象或事件的程度

例:员工工资是按实际工作时间计算的吗?

· 完整性——存储在数据集中的数据占 100% 潜力的比例

示例:地址记录是否包含将邮件发送到目的地所需的所有地址字段中的数据?完整的邮政编码?国家的名字?

· 一致性- 将事物的两个或多个表示与定义进行比较时不存在差异

示例:一个表中是否包含属于特定部门的数据,即使该部门在重组后已被消除?

· 及时性——从所需时间点开始,数据代表现实的程度

示例:如果预算决策是根据销售统计数据做出的,那么销售数据提供给决策者的速度有多快?

· 唯一性- 根据事物的识别方式,不会多次记录任何项目或实体实例

示例:当系统更新记录时,您能否确定它不会创建具有更多最新信息的原始记录的副本?

· 有效性或一致性——数据符合其定义的语法(格式、类型或范围)的程度

示例:1000 Data Way 的街道地址是有效的(虽然不一定准确),而 /03H8 Data Way 的地址则无效。 

数据团队必须对必要的数据质量水平进行自己的评估,以符合数据健康的要求——他们应该能够向数据用户证明该质量水平,因此他们反过来可以自信地使用数据。但请记住,可靠但不可用或不可信的数据仍然不能支持业务决策。这不是健康的数据。 

由于数据健康是衡量数据对业务价值的衡量标准,因此透明度和可访问性与质量一样重要。如果决策者无法随时访问他们需要的数据,那么组织也可能没有这些数据。另一方面,个人身份信息 (PII) 的数据隐私可能适用。在这些情况下,最好将一些数据与非特权用户隔离。一个强大的数据治理技术平台,招募相关业务专家作为数据管理员,有助于提高数据准确性和安全性。

在您的组织中,数据健康指标可能包括其他因素,例如合理性和完整性。无论您包括什么因素,关键是能够依靠您的数据在整个企业中发挥作用。您在每个维度上对数据的评级越高,您就越能认为您的数据更健康。 

数据质量评估

一旦您知道要衡量什么,您将如何评估数据的质量状况?  

整体数据健康系统依赖于数据质量的通用指标。使用标准指标,可以评估数据的可信度和可操作性。如上所述,对于准备公司数据的人来说,仅知道数据符合质量标准是不够的。最终用户只有在拥有证明数据质量的指标时才能真正信任他们的决定。

您可以使用该软件来获取有关数据健康状况的读数并修复不健康的数据。理想情况下,您应该能够即时了解您可以信任的数据,并拥有修复您不能信任的数据的工具。该平台应通过提供自助访问、普遍的数据质量工具和涵盖端到端的所有数据流和数据源的综合治理功能来解决数据健康问题。

您的数据有多健康?

您对您的组织提供决策就绪数据的能力有信心吗?您是否想知道您的数据健康统计数据?亿信华辰可以提供帮助。从免费检查开始:导出数据的子集并通过亿信华辰数据质量管理平台运行它 。这项软件服务可快速评估您数据的有效性、完整性和唯一性。如果您只是想看看它是如何工作的,请先使用我们的示例数据集进行尝试。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议