数据治理知识:怎么判断数据质量是否健康?

发布时间:2021.06.10来源:亿信华辰数据治理知识库浏览量:97次标签:数据治理

世界各地的组织比以往任何时候都更依赖数据。但是,每天被数据包围和使用数据来做出日常业务决策是有区别的。实现基本业务目标的唯一方法是根据高质量、可信的数据(健康数据)采取行动。但我们生活在大数据时代,一个组织管理的数据越多,保持这些数据的健康就越困难。  

大多数人凭直觉就知道,健康的数据应该是干净、完整的,并且符合法律和监管要求。不幸的是,仅凭这些因素并不能保证数据已准备好用于业务决策。大多数组织无法衡量其数据的健康程度——依赖无法衡量健康状况的数据是愚蠢的。部分问题在于,虽然人们认为他们了解数据健康意味着什么,但他们很难定义或评估数据质量是否健康

<a href=数据治理知识.jpg" width="565" height="303" style="width: 565px; height: 303px;"/>

让我们从数据健康的明确定义开始。  

数据质量健康定义

数据质量健康是衡量数据决策准备情况的指标。要了解您组织的数据是否健康,您必须能够证明其有效、完整且具有足够的质量,以生成决策者可以放心依赖于业务决策的分析。  

亿信华辰的数据健康愿景是一个技术和行为系统协同工作,以确保可信、可靠数据的自由流动。健康数据意味着组织中的每个人都可以在需要时访问他们需要的信息,并在不怀疑其有效性的情况下使用它。 

与任何医疗保健系统一样,数据健康涉及整个生命周期的监控和干预。我们在预防、治疗和社区支持的框架中考虑数据健康: 

· 预防性护理:先发制人地识别数据挑战

· 有效的处理方法:系统地解决数据可靠性问题和风险  

· 支持性文化:建立协作数据管理学科 

通过数据健康指标来证明数据的业务价值,组织几乎可以改进其运营的任何方面:

· 增强销售和营销分析  

· 解决数据治理和合规性问题  

· 改进业务流程  

· 转变客户体验

· 推动 360 度参与  

· 启用机器学习和人工智能  

如果没有健康的数据,所有这些过程都会出错。如果您工作所依据的可用数据不准确、不受控制或过时,您就无法找到合适的客户、缩短销售周期或改进流程。不健康的数据会耗费公司决策的时间和质量,从而增加成本并对收入产生负面影响。随着您扩展到使用大数据,数据的健康变得越来越重要。对于使用大数据的公司来说,制定健康指标至关重要。

那么如何判断数据是否健康呢?

衡量数据健康状况

数据质量是数据健康的主要考虑因素。英国 数据管理协会定义了衡量数据质量的六个维度: 

· 准确性- 数据正确描述所描述的现实世界对象或事件的程度

例:员工工资是按实际工作时间计算的吗?

· 完整性——存储在数据集中的数据占 100% 潜力的比例

示例:地址记录是否包含将邮件发送到目的地所需的所有地址字段中的数据?完整的邮政编码?国家的名字?

· 一致性- 将事物的两个或多个表示与定义进行比较时不存在差异

示例:一个表中是否包含属于特定部门的数据,即使该部门在重组后已被消除?

· 及时性——从所需时间点开始,数据代表现实的程度

示例:如果预算决策是根据销售统计数据做出的,那么销售数据提供给决策者的速度有多快?

· 唯一性- 根据事物的识别方式,不会多次记录任何项目或实体实例

示例:当系统更新记录时,您能否确定它不会创建具有更多最新信息的原始记录的副本?

· 有效性或一致性——数据符合其定义的语法(格式、类型或范围)的程度

示例:1000 Data Way 的街道地址是有效的(虽然不一定准确),而 /03H8 Data Way 的地址则无效。 

数据团队必须对必要的数据质量水平进行自己的评估,以符合数据健康的要求——他们应该能够向数据用户证明该质量水平,因此他们反过来可以自信地使用数据。但请记住,可靠但不可用或不可信的数据仍然不能支持业务决策。这不是健康的数据。 

由于数据健康是衡量数据对业务价值的衡量标准,因此透明度和可访问性与质量一样重要。如果决策者无法随时访问他们需要的数据,那么组织也可能没有这些数据。另一方面,个人身份信息 (PII) 的数据隐私可能适用。在这些情况下,最好将一些数据与非特权用户隔离。一个强大的数据治理技术平台,招募相关业务专家作为数据管理员,有助于提高数据准确性和安全性。

在您的组织中,数据健康指标可能包括其他因素,例如合理性和完整性。无论您包括什么因素,关键是能够依靠您的数据在整个企业中发挥作用。您在每个维度上对数据的评级越高,您就越能认为您的数据更健康。 

数据质量评估

一旦您知道要衡量什么,您将如何评估数据的质量状况?  

整体数据健康系统依赖于数据质量的通用指标。使用标准指标,可以评估数据的可信度和可操作性。如上所述,对于准备公司数据的人来说,仅知道数据符合质量标准是不够的。最终用户只有在拥有证明数据质量的指标时才能真正信任他们的决定。

您可以使用该软件来获取有关数据健康状况的读数并修复不健康的数据。理想情况下,您应该能够即时了解您可以信任的数据,并拥有修复您不能信任的数据的工具。该平台应通过提供自助访问、普遍的数据质量工具和涵盖端到端的所有数据流和数据源的综合治理功能来解决数据健康问题。

您的数据有多健康?

您对您的组织提供决策就绪数据的能力有信心吗?您是否想知道您的数据健康统计数据?亿信华辰可以提供帮助。从免费检查开始:导出数据的子集并通过亿信华辰数据质量管理平台运行它 。这项软件服务可快速评估您数据的有效性、完整性和唯一性。如果您只是想看看它是如何工作的,请先使用我们的示例数据集进行尝试。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据共享与开发平台

    数据共享与开发平台

    随着经济和社会信息化进程的不断加快,信息资源已经成为重要的战略资源。促进信息资源共享、加强信息资源开发利用,对于提高经济发展效率和社会管……查看详情

    发布时间:2020.08.14来源:知乎浏览量:69次

  • 数据治理唤醒“沉睡数据”

    数据治理唤醒“沉睡数据”

    十九届四中全会提出:“建立健全运用互联网、大数据、人工智能等技术手段进行行政管理的制度规则。推进数字政府建设,加强数据有序共享,依法保护……查看详情

    发布时间:2019.11.28来源:知乎浏览量:70次

  • 数据治理不应成为吞下难以接受的药物

    数据治理不应成为吞下难以接受的药物

    对于制药公司而言,数据治理是数据管理难题的关键部分。……查看详情

    发布时间:2019.01.17来源:亿信华辰浏览量:95次

  • 数据质量提升的必要性

    数据质量提升的必要性

    高质量的数据对管理决策,业务支撑都有极其重要的作用。有些项目在初期由于并没有考虑数据质量的因素,导致了项目实施后期才发现,由于数据质量问……查看详情

    发布时间:2022.02.18来源:小亿浏览量:468次

  • 数据治理的伦理 - “数据带来利益和负债”

    数据治理的伦理 - “数据带来利益和负债”

    数据从未像现在这样强大。2018年发现了一些历史上最大的数据泄露事件,包括万豪酒店集团违规行为和剑桥分析公司丑闻,两者都对国际关系产生了……查看详情

    发布时间:2019.03.12来源:亿信华辰浏览量:85次

  • 7点数据治理实践方法

    7点数据治理实践方法

    Gartner定义了七项良好的数据治理运作的原则,通过遵循这些最佳实践准则并提出以下问题,您可以为成功的数据治理策略做好准备。……查看详情

    发布时间:2021.06.23来源:亿信数据治理知识库浏览量:91次

  • 数据质量监控步骤及方法

    数据质量监控步骤及方法

    随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖……查看详情

    发布时间:2020.08.31来源:CSDN浏览量:93次

  • 大数据时代如何做好数据治理

    大数据时代如何做好数据治理

    企业在建制大数据平台的同时,对进入数据湖的数据进行梳理,并按照数据资产目录的形式对外发布。在发布数据资产之后,则对进出数据湖……查看详情

    发布时间:2018.12.10来源:数据治理浏览量:58次

  • 数据囤积日益增长的威胁

    数据囤积日益增长的威胁

    在数据丰富的环境中生活和工作的缺点之一是希望将所有最后的位和字节松开以备将来使用。得益于Amazon S3和Hadoop等廉价存储系统,……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:67次

  • 如何确定数据治理工具与数据中心及信息系统的关系

    如何确定数据治理工具与数据中心及信息系统的关系

    通过实施数据治理工具,可以让数据质量变得更好,发掘数据资产的商业价值,实现如下目标:对业务的支撑;降低经营风险、安全保障;对决策进行支持……查看详情

    发布时间:2021.04.30来源:亿信数据治理知识库浏览量:90次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议