数据治理知识:怎么判断数据质量是否健康?

发布时间:2021.06.10来源:亿信华辰数据治理知识库浏览量:215次标签:数据治理

世界各地的组织比以往任何时候都更依赖数据。但是,每天被数据包围和使用数据来做出日常业务决策是有区别的。实现基本业务目标的唯一方法是根据高质量、可信的数据(健康数据)采取行动。但我们生活在大数据时代,一个组织管理的数据越多,保持这些数据的健康就越困难。  

大多数人凭直觉就知道,健康的数据应该是干净、完整的,并且符合法律和监管要求。不幸的是,仅凭这些因素并不能保证数据已准备好用于业务决策。大多数组织无法衡量其数据的健康程度——依赖无法衡量健康状况的数据是愚蠢的。部分问题在于,虽然人们认为他们了解数据健康意味着什么,但他们很难定义或评估数据质量是否健康

<a href=数据治理知识.jpg" width="565" height="303" style="width: 565px; height: 303px;"/>

让我们从数据健康的明确定义开始。  

数据质量健康定义

数据质量健康是衡量数据决策准备情况的指标。要了解您组织的数据是否健康,您必须能够证明其有效、完整且具有足够的质量,以生成决策者可以放心依赖于业务决策的分析。  

亿信华辰的数据健康愿景是一个技术和行为系统协同工作,以确保可信、可靠数据的自由流动。健康数据意味着组织中的每个人都可以在需要时访问他们需要的信息,并在不怀疑其有效性的情况下使用它。 

与任何医疗保健系统一样,数据健康涉及整个生命周期的监控和干预。我们在预防、治疗和社区支持的框架中考虑数据健康: 

· 预防性护理:先发制人地识别数据挑战

· 有效的处理方法:系统地解决数据可靠性问题和风险  

· 支持性文化:建立协作数据管理学科 

通过数据健康指标来证明数据的业务价值,组织几乎可以改进其运营的任何方面:

· 增强销售和营销分析  

· 解决数据治理和合规性问题  

· 改进业务流程  

· 转变客户体验

· 推动 360 度参与  

· 启用机器学习和人工智能  

如果没有健康的数据,所有这些过程都会出错。如果您工作所依据的可用数据不准确、不受控制或过时,您就无法找到合适的客户、缩短销售周期或改进流程。不健康的数据会耗费公司决策的时间和质量,从而增加成本并对收入产生负面影响。随着您扩展到使用大数据,数据的健康变得越来越重要。对于使用大数据的公司来说,制定健康指标至关重要。

那么如何判断数据是否健康呢?

衡量数据健康状况

数据质量是数据健康的主要考虑因素。英国 数据管理协会定义了衡量数据质量的六个维度: 

· 准确性- 数据正确描述所描述的现实世界对象或事件的程度

例:员工工资是按实际工作时间计算的吗?

· 完整性——存储在数据集中的数据占 100% 潜力的比例

示例:地址记录是否包含将邮件发送到目的地所需的所有地址字段中的数据?完整的邮政编码?国家的名字?

· 一致性- 将事物的两个或多个表示与定义进行比较时不存在差异

示例:一个表中是否包含属于特定部门的数据,即使该部门在重组后已被消除?

· 及时性——从所需时间点开始,数据代表现实的程度

示例:如果预算决策是根据销售统计数据做出的,那么销售数据提供给决策者的速度有多快?

· 唯一性- 根据事物的识别方式,不会多次记录任何项目或实体实例

示例:当系统更新记录时,您能否确定它不会创建具有更多最新信息的原始记录的副本?

· 有效性或一致性——数据符合其定义的语法(格式、类型或范围)的程度

示例:1000 Data Way 的街道地址是有效的(虽然不一定准确),而 /03H8 Data Way 的地址则无效。 

数据团队必须对必要的数据质量水平进行自己的评估,以符合数据健康的要求——他们应该能够向数据用户证明该质量水平,因此他们反过来可以自信地使用数据。但请记住,可靠但不可用或不可信的数据仍然不能支持业务决策。这不是健康的数据。 

由于数据健康是衡量数据对业务价值的衡量标准,因此透明度和可访问性与质量一样重要。如果决策者无法随时访问他们需要的数据,那么组织也可能没有这些数据。另一方面,个人身份信息 (PII) 的数据隐私可能适用。在这些情况下,最好将一些数据与非特权用户隔离。一个强大的数据治理技术平台,招募相关业务专家作为数据管理员,有助于提高数据准确性和安全性。

在您的组织中,数据健康指标可能包括其他因素,例如合理性和完整性。无论您包括什么因素,关键是能够依靠您的数据在整个企业中发挥作用。您在每个维度上对数据的评级越高,您就越能认为您的数据更健康。 

数据质量评估

一旦您知道要衡量什么,您将如何评估数据的质量状况?  

整体数据健康系统依赖于数据质量的通用指标。使用标准指标,可以评估数据的可信度和可操作性。如上所述,对于准备公司数据的人来说,仅知道数据符合质量标准是不够的。最终用户只有在拥有证明数据质量的指标时才能真正信任他们的决定。

您可以使用该软件来获取有关数据健康状况的读数并修复不健康的数据。理想情况下,您应该能够即时了解您可以信任的数据,并拥有修复您不能信任的数据的工具。该平台应通过提供自助访问、普遍的数据质量工具和涵盖端到端的所有数据流和数据源的综合治理功能来解决数据健康问题。

您的数据有多健康?

您对您的组织提供决策就绪数据的能力有信心吗?您是否想知道您的数据健康统计数据?亿信华辰可以提供帮助。从免费检查开始:导出数据的子集并通过亿信华辰数据质量管理平台运行它 。这项软件服务可快速评估您数据的有效性、完整性和唯一性。如果您只是想看看它是如何工作的,请先使用我们的示例数据集进行尝试。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 当下企业数据治理有哪些重要性?

    当下企业数据治理有哪些重要性?

    随着大数据相关技术的不断成熟,数据作为一种资产,得到了越来越多企业机构的重视,为了能够有效的利用数据资产,数据治理成了当下政府和企业重点……查看详情

    发布时间:2019.07.18来源:知乎浏览量:136次

  • 数据治理-理数据,现状分析

    数据治理-理数据,现状分析

    针对企业数据治理所处的内外部环境,从组织、人员、流程、数据四个方面入手,进行数据治理现状的分析。……查看详情

    发布时间:2020.07.17来源:知乎浏览量:248次

  • 2021权威解读:大数据治理包括哪些内容

    2021权威解读:大数据治理包括哪些内容

    ​近年来数据治理越来越受到国内外研究机构和学者的关注,在数据治理的框架设计等方面均取得了很多研究成果,并在商业、教育、医疗等以数据为核心……查看详情

    发布时间:2021.04.02来源:数据治理研究院浏览量:421次

  • 知否?知否?如何利用元数据管理数据资产

    知否?知否?如何利用元数据管理数据资产

    如今,各大企业都在关心数据该如何使用,但大数据应用的前提是有高质量的数据。而很多企业内部数据形态多样,标准不统一,大数据应用往往得从数据……查看详情

    发布时间:2020.09.18来源:知乎浏览量:184次

  • 为什么集成和治理对数据湖成功至关重要

    为什么集成和治理对数据湖成功至关重要

    这是一个由三部分组成的系列文章的最后一篇文章,探讨如何构建一个能够满足真正企业级数据管理平台所有要求的数据湖。虽然早期的专题文章侧重于H……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:151次

  • DAMA 数据管理知识体系指南-数据管理方方面面的一部代表性著作

    DAMA 数据管理知识体系指南-数据管理方方面面的一部代表性著作

    本书由DAMA International组织众多数据管理领域的国际级资深专家编著。这是一项里程碑式的工作。数据管理是把业务和信息技术融……查看详情

    发布时间:2018.11.29来源:DAMA浏览量:291次

  • 从元数据角度来认识大数据

    从元数据角度来认识大数据

    什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数……查看详情

    发布时间:2020.02.21来源:知乎浏览量:215次

  • 数据湖治理最佳实践

    数据湖治理最佳实践

    如果没有最佳实践,存储将变得无法维护。自动化数据质量,生命周期和隐私可以持续清理/移动湖中的数据。……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:180次

  • 数据治理没有权威定义

    数据治理没有权威定义

    数据治理没有权威定义,但在实践中,它要么是管理数据资产以确保可信度和责任的首要过程,要么是所述流程的最高级别,即制定决策和制定策略的流程……查看详情

    发布时间:2018.12.04来源:Daniel Howard,Philip Howard浏览量:159次

  • 企业数据治理项目如何落地?

    企业数据治理项目如何落地?

    数据治理在系统层面包括数据标准、元数据、数据质量、生命周期管理、数据安全、数据资产共六大核心模块;在管理层面需要通过数据治理组织、数据治……查看详情

    发布时间:2020.06.29来源:知乎浏览量:183次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议