数据治理知识:怎么判断数据质量是否健康?

发布时间:2021.06.10来源:亿信华辰数据治理知识库浏览量:181次标签:数据治理

世界各地的组织比以往任何时候都更依赖数据。但是,每天被数据包围和使用数据来做出日常业务决策是有区别的。实现基本业务目标的唯一方法是根据高质量、可信的数据(健康数据)采取行动。但我们生活在大数据时代,一个组织管理的数据越多,保持这些数据的健康就越困难。  

大多数人凭直觉就知道,健康的数据应该是干净、完整的,并且符合法律和监管要求。不幸的是,仅凭这些因素并不能保证数据已准备好用于业务决策。大多数组织无法衡量其数据的健康程度——依赖无法衡量健康状况的数据是愚蠢的。部分问题在于,虽然人们认为他们了解数据健康意味着什么,但他们很难定义或评估数据质量是否健康

<a href=数据治理知识.jpg" width="565" height="303" style="width: 565px; height: 303px;"/>

让我们从数据健康的明确定义开始。  

数据质量健康定义

数据质量健康是衡量数据决策准备情况的指标。要了解您组织的数据是否健康,您必须能够证明其有效、完整且具有足够的质量,以生成决策者可以放心依赖于业务决策的分析。  

亿信华辰的数据健康愿景是一个技术和行为系统协同工作,以确保可信、可靠数据的自由流动。健康数据意味着组织中的每个人都可以在需要时访问他们需要的信息,并在不怀疑其有效性的情况下使用它。 

与任何医疗保健系统一样,数据健康涉及整个生命周期的监控和干预。我们在预防、治疗和社区支持的框架中考虑数据健康: 

· 预防性护理:先发制人地识别数据挑战

· 有效的处理方法:系统地解决数据可靠性问题和风险  

· 支持性文化:建立协作数据管理学科 

通过数据健康指标来证明数据的业务价值,组织几乎可以改进其运营的任何方面:

· 增强销售和营销分析  

· 解决数据治理和合规性问题  

· 改进业务流程  

· 转变客户体验

· 推动 360 度参与  

· 启用机器学习和人工智能  

如果没有健康的数据,所有这些过程都会出错。如果您工作所依据的可用数据不准确、不受控制或过时,您就无法找到合适的客户、缩短销售周期或改进流程。不健康的数据会耗费公司决策的时间和质量,从而增加成本并对收入产生负面影响。随着您扩展到使用大数据,数据的健康变得越来越重要。对于使用大数据的公司来说,制定健康指标至关重要。

那么如何判断数据是否健康呢?

衡量数据健康状况

数据质量是数据健康的主要考虑因素。英国 数据管理协会定义了衡量数据质量的六个维度: 

· 准确性- 数据正确描述所描述的现实世界对象或事件的程度

例:员工工资是按实际工作时间计算的吗?

· 完整性——存储在数据集中的数据占 100% 潜力的比例

示例:地址记录是否包含将邮件发送到目的地所需的所有地址字段中的数据?完整的邮政编码?国家的名字?

· 一致性- 将事物的两个或多个表示与定义进行比较时不存在差异

示例:一个表中是否包含属于特定部门的数据,即使该部门在重组后已被消除?

· 及时性——从所需时间点开始,数据代表现实的程度

示例:如果预算决策是根据销售统计数据做出的,那么销售数据提供给决策者的速度有多快?

· 唯一性- 根据事物的识别方式,不会多次记录任何项目或实体实例

示例:当系统更新记录时,您能否确定它不会创建具有更多最新信息的原始记录的副本?

· 有效性或一致性——数据符合其定义的语法(格式、类型或范围)的程度

示例:1000 Data Way 的街道地址是有效的(虽然不一定准确),而 /03H8 Data Way 的地址则无效。 

数据团队必须对必要的数据质量水平进行自己的评估,以符合数据健康的要求——他们应该能够向数据用户证明该质量水平,因此他们反过来可以自信地使用数据。但请记住,可靠但不可用或不可信的数据仍然不能支持业务决策。这不是健康的数据。 

由于数据健康是衡量数据对业务价值的衡量标准,因此透明度和可访问性与质量一样重要。如果决策者无法随时访问他们需要的数据,那么组织也可能没有这些数据。另一方面,个人身份信息 (PII) 的数据隐私可能适用。在这些情况下,最好将一些数据与非特权用户隔离。一个强大的数据治理技术平台,招募相关业务专家作为数据管理员,有助于提高数据准确性和安全性。

在您的组织中,数据健康指标可能包括其他因素,例如合理性和完整性。无论您包括什么因素,关键是能够依靠您的数据在整个企业中发挥作用。您在每个维度上对数据的评级越高,您就越能认为您的数据更健康。 

数据质量评估

一旦您知道要衡量什么,您将如何评估数据的质量状况?  

整体数据健康系统依赖于数据质量的通用指标。使用标准指标,可以评估数据的可信度和可操作性。如上所述,对于准备公司数据的人来说,仅知道数据符合质量标准是不够的。最终用户只有在拥有证明数据质量的指标时才能真正信任他们的决定。

您可以使用该软件来获取有关数据健康状况的读数并修复不健康的数据。理想情况下,您应该能够即时了解您可以信任的数据,并拥有修复您不能信任的数据的工具。该平台应通过提供自助访问、普遍的数据质量工具和涵盖端到端的所有数据流和数据源的综合治理功能来解决数据健康问题。

您的数据有多健康?

您对您的组织提供决策就绪数据的能力有信心吗?您是否想知道您的数据健康统计数据?亿信华辰可以提供帮助。从免费检查开始:导出数据的子集并通过亿信华辰数据质量管理平台运行它 。这项软件服务可快速评估您数据的有效性、完整性和唯一性。如果您只是想看看它是如何工作的,请先使用我们的示例数据集进行尝试。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 中小行纷纷设立数据治理专营部门

    中小行纷纷设立数据治理专营部门

    “数据治理基础建设缺失、人才匮乏、意识觉醒较晚。”一名来参加今日第三届中国数字银行论坛的西部中小银行人士,用了三个并列短句,来形容目前中……查看详情

    发布时间:2019.11.29来源:CSDN浏览量:133次

  • 可量身定制的数据治理平台

    可量身定制的数据治理平台

    在大数据浪潮下,大数据平台建设如火如荼,大数据平台建设本质上是数据的建设。由于数据量逐渐庞大导致的一系列问题,使很多用户意识到数据治理的……查看详情

    发布时间:2019.11.22来源:CSDN浏览量:209次

  • 数据治理到底应该怎么治?

    数据治理到底应该怎么治?

    数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点……查看详情

    发布时间:2020.07.07来源:知乎浏览量:151次

  •  数据治理目标是什么?数据治理框架包括哪些方面?

    数据治理目标是什么?数据治理框架包括哪些方面?

    ​数据治理涵盖了数据质量、数据建模和架构、数据存储、数据操作、商业智能、数据沿袭、文档、数据集成和数据安全等.制定数据治理计划前我们需要……查看详情

    发布时间:2021.07.22来源:亿信华辰数据治理浏览量:500次

  • 杰出数据科学家的关键技能是什么?

    杰出数据科学家的关键技能是什么?

    学习如何应用不同的Python或R算法真的很简单:众所周知, 我们只需要修改一两行代码,就能将线性回归迁移到神经网络、SVM,或者你喜欢……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:135次

  • 数据信任是智能城市数据治理的一部分吗?

    数据信任是智能城市数据治理的一部分吗?

    鉴于最近的丑闻,城市别无选择,只能紧急关注数据治理问题。数据信任可以成为解决方案的一部分吗?……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:125次

  • 建立统一的数据交换平台实现各部门的数据共享

    建立统一的数据交换平台实现各部门的数据共享

    要实现各部门的数据共享,必须先建立统一的数据交换平台,通过交换平台实现各异构数据库之间的数据集成,实现原有各业务系统在数据级集成,保证异……查看详情

    发布时间:2020.08.21来源:知乎浏览量:203次

  • 银行业数据治理实践难点及应对-数据治理实践

    银行业数据治理实践难点及应对-数据治理实践

    数据治理已成为在全球各国领导层面进行讨论的中心议题,其背景和目的,主要是旨在推动建立新的国际数据监管体系。在我国的金融行业中,随着互联网……查看详情

    发布时间:2019.12.20来源:知乎浏览量:167次

  • 数据平台,数据中台是什么数据?

    数据平台,数据中台是什么数据?

    数据中台最核心的就是data API,它提供一个一个的可以复用的标准,这种数据服务给到业务系统。构建数据中台和构建数据平台也有很大的区别……查看详情

    发布时间:2021.01.23来源:知乎浏览量:135次

  • 微软收购BlueTalon以支持数据治理产品

    微软收购BlueTalon以支持数据治理产品

    微软今天宣布收购BlueTalon,这是一家总部位于加利福尼亚州雷德伍德市的跨平台数据访问控制解决方案提供商,收购金额不详。Azure ……查看详情

    发布时间:2019.08.02来源:知乎浏览量:106次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议