数据治理管理干货 | 数据质量管理的方法

发布时间:2021.06.22来源:亿信数据治理知识库浏览量:185次标签:数据治理

数据质量管理数据治理的重要步骤。这是准备数据以符合质量标准(例如有效性,均匀性,准确性,一致性和完整性)的过程。数据质量管理可从数据集中删除不需要的,重复的和不正确的数据,从而帮助分析师获得更加准确的数据

企业中的大多数使用高级数据工具来收集大量数据。原始数据通常包含错误,如果不做数据质量管理,可能会导致错误的结果。数据质量管理是数据治理中获得正确上下文和结论的基本步骤。

一、数据质量管理的方法之设置质量标准

数据质量管理的第一步是建立一套质量标准。必须明确定义标准,以从数据集中过程中过滤掉“脏数据”。您可以定义以下几个条件。

数据约束:有多种类型的数据约束可确保收集的数据具有最佳质量,例如:

· 数据类型约束:仅限于注册值的范围,例如布尔值,数字,日期等。

· 范围限制:数值不是绝对的,而是具有最小和/或最大允许值。

· 强制性约束:必须填写所有列。

· 唯一性约束:每个字段或字段组合在整个数据集中都必须是唯一的。

· 成员资格约束:每列中的一组离散值或代码。

· 外键约束:子值可以通过一组允许值添加到其他列。 

· 正则表达式模式:设置允许的模式,例如电话号码,站号,密码等模式。

设置数据约束有助于在数据收集过程的一开始就保持数据质量。

二、数据质量管理的方法之确保准确性

尽管数据约束在一定程度上确保了正确的数据值,但考虑到该领域的主观方面,准确性仍然是一个挑战。例如,如果必须填写街道地址,则设置模式约束有助于确保密码和状态正确,但是街道地址可能不正确。

进一步有可能规避图案。例如,尽管电话号码格式正确,但是该电话号码可能不正确或无法操作。     

三、数据质量管理的方法之删除重复数据 

当您组合多个数据集以生成洞察力时,数据集中就会出现重复。重复的数据可能是数据不完整的结果,也可能是数据结构中的问题。例如,在医院数据集中,如果同一位患者因其他疾病而来访,您可能不希望将其视为来自同一位置,具有相同电话号码的两名不同患者。此类数据重复会产生偏差,从而大范围地影响结果。

四、数据质量管理的方法之仅接受完整数据 

尽管大多数软件工具不接受不完整的数据,但是使用电子表格或基于纸张的表格可能会导致数据不完整。例如,在维护检查表中,由于信息的不了解或不可用,所提供的问题或解决方案的类型可能不会描述为完整的字段或某些空白字段。

五、数据质量管理的方法之保持一致性和统一性

当不同字段中的两个值相互矛盾时,数据不一致。合并多个部门或时间范围的数据时,会发生这种情况。例如,在旧数据中,员工的名称必须与现在的名称不同。如果数据未正确排序,则此类问题可能会影响数据的结果。

数据的一致性是指度量单位。数据的一致性和统一性对于获得准确的结果至关重要。

六、数据质量管理的方法之提高准确性

数据质量管理是一个三步过程,其中包括考虑上述所有条件以维护数据完整性。根据上述标准收集数据后,可以采取以下措施来提高准确性。  

· 检验:执行检验以检测整个质量标准中数据的不准确性

· 清理:从数据集中删除异常

· 验证:对清洁过程进行交叉验证,以确保消除了每个方面的不准确性和不一致性

· 报告:创建有关所做的更改以及有关系统中记录的数据的当前质量的报告。

数据质量管理必须是一个连续的过程,因为时间,情况会发生变化,并且会影响记录的数据质量。过时的旧数据可能没有帮助。例如,如果您不更新自己的现场销售CRM数据,从长远来看,可能会影响您的销售潜力。

定期进行数据治理管理有助于您获得准确的见解。准确的数据助力您的业务决策并成功推动您的战略。

七、数据质量管理平台工具介绍

亿信华辰数据质量管理以数据标准为数据检核依据,以元数据为数据检核对象,通过向导化、可视化等简易操作手段,将质量评估、质量检核、质量整改与质量报告等工作环节进行流程整合,形成完整的数据质量管理闭环。亿信华辰数据质量管理平台案例如下:

数据质量管理案例.jpg

了解更多数据质量管理平台案例:https://www.esenruizhi.com/products/esdataclean.html

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理的全球难题:法治化治理如何跟上技术更新步伐?

    数据治理的全球难题:法治化治理如何跟上技术更新步伐?

    随着技术的发展,需要治理的已不只是数据,人工智能算法等领域也成为治理课题。数据、互联网平台、人工智能算法应该如何治理?这在全球范围内都是……查看详情

    发布时间:2019.10.25来源:知乎浏览量:123次

  • 读懂工业大数据 这篇文章不得不看

    读懂工业大数据 这篇文章不得不看

    工业大数据是互联网、大数据和工业产业结合的产物,是中国制造2025、工业互联网、工业4.0等国家战略在企业的落脚点。……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:131次

  • 数据治理过程中核心数据界定怎么破?

    数据治理过程中核心数据界定怎么破?

    数据治理过程中,在我们费了九牛二虎之力盘点出企业当前数据资产的家当,形成了数据资产的清单后,同时也会列明这个业务域的核心数据实体,这就碰……查看详情

    发布时间:2019.08.08来源:CSDN浏览量:141次

  • 数据治理与数据质量有何不同?

    数据治理与数据质量有何不同?

    当下是一个大数据的时代,有越来越多的企业开始应用大数据来创造价值,为了能够充分的利用数据价值,企业需要对数据进行管理,当我们听到数据管理……查看详情

    发布时间:2019.07.26来源:知乎浏览量:159次

  • 正确的数据文化是数据治理成功的预测指标

    正确的数据文化是数据治理成功的预测指标

    获得数据治理计划的业务和领导支持 - 以及在该支持下建立数据文化 - 仍然是许多组织面临的重大挑战。然而,根据一项新的调查,获得这种支持……查看详情

    发布时间:2019.02.25来源:亿信华辰浏览量:146次

  • 金融服务数据治理:帮助价值'新货币'

    金融服务数据治理:帮助价值'新货币'

    对于在金融服务领域运营的组织,数据治理变得越来越重要。当金融服务行业董事会成员和高管在2018年初聚集在安永的金融服务领导峰会时,数据是……查看详情

    发布时间:2018.12.03来源:Michael Pastore浏览量:142次

  • 企业如何做好数据安全管理?

    企业如何做好数据安全管理?

    数据安全对企业生存发展举足轻重,数据资产的外泄、破坏都会导致无可挽回的经济损失和核心竞争力缺失。而绝大多数中小企业注重业务的快速发展,往……查看详情

    发布时间:2022.05.27来源:小亿浏览量:289次

  • 企业如何快速实现一个数据治理项目

    企业如何快速实现一个数据治理项目

    大数据治理是诸多数据问题的全面解决之道。企业只有建立了完整的大数据治理体系,保证数据的质量,才能够真正有效地挖掘企业内部的数据价值,对外……查看详情

    发布时间:2020.03.19来源:知乎浏览量:152次

  • 企业如何快速启动数据治理项目?

    企业如何快速启动数据治理项目?

    大数据时代已经到来,各个政府机关,大中小企业都越来越重视数据的价值。然而在企业的运转过程中,却经常会产生各种各样的数据问题。……查看详情

    发布时间:2019.08.15来源:知乎浏览量:141次

  • 2019年需要关注的三个治理趋势

    2019年需要关注的三个治理趋势

    通过精心应用RPA,优先考虑数据质量,并迎合不断变化的劳动力构成,数据专业人员可以有效地指导他们的组织进入数据驱动的未来。……查看详情

    发布时间:2018.12.20来源:亿信华辰浏览量:120次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议