如何保证数据质量、数据治理:让数据质量更好

发布时间:2019.09.12来源:知乎浏览量:161次标签:数据治理

数据分析、数据挖掘等各种数据应用都离不开数据质量,数据质量的重要性不用多表。今天来浅谈如何通过数据治理,来保证数据质量。数据的生命周期往往会有以下4个过程:数据的产生、存储、加工和应用。 数据质量在这四个环节均会产生,所以需要有不同的手段。

1、数据产生阶段
这个阶段是数据质量问题的重灾区,无论是手工录入的数据,还是生产系统产生的数据,都会因为各种原因导致数据质量问题,比如手抖输错、生产系统波动等。对于这个阶段的问题,我们对应的手段是:控制输入

对于手动录入的数据,尽可能的使用非开放式的输入手段,如下拉菜单、单复选框、时间控件、标签(支持自定义学习型)等,必须开放的输入部分,进行必要的及时校验。另外在数据进入系统前,可以设立监控点,出现错误数据可以及时预警(邮件、信息手段进行通知)。

2、数据存储阶段
方法:数据统一及数据清洗
在数据仓库或数据中心建立时,就按照数据标准对关键字段进行统一命名、格式、精度等,排除数据的歧义。
对于已经存储在数仓中的数据,发现质量问题,就得使用数据质量管控工具了,这里推荐亿信睿治数据治理平台中的数据质量模块,可以很方便的检查出数据质量问题,且内置了丰富的清洗组件,不需要使用代码就可以完成对于大多数数据质量问题的便捷清洗。

3、数据加工阶段的质量管控手段
方法:数据质量管理工具
这个阶段的数据会经历很多过程,比如被引用,指标计算,从ODS层到集市层等,通过人力来管理的话,人力成本太高了。在这里还是推荐睿治数据治理平台的数据质量模块(没办法,的确好用),此软件数据质量功能模块支持在数据流向的各个节点进行数据质量监测,不仅可以进行实时数据质量的预警,还可以对已有数据进行数据质量校验,内置了很多种数据质量规则,没有研发经验的也能用得飞起,对技术小白很友好。

4、数据应用阶段的质量管理手段
数据使用阶段还需要质量管理?当然!
无论是在数据分析还是数据挖掘之后,结果自然是要保存下来的,此时的数据仍然要按照标准,进行规范的管理,无论是存储结果的表名,还是字段、格式等。此外,在数据分析、挖掘的时候,也会有新的数据产生,此时依然需要进行标准化之后进行统一管理。有新的数据质量问题产生,仍然需要想应的数据清洗工具进行清洗后再保存。

写在最后,数据质量问题对于很多企业已经是迫在眉睫需要解决的问题了,是时候开展数据治理了。话分两头讲,对于已有数据,通过数据质量管理工具进行校验和清洗,另外建立数据质量管控体系,通过PDCA闭环结构不断地提升数据质量;

数据质量
另外对于系统原因造成的数据质量问题,我们需要建立数据标准体系,对于可以改造的生产系统,在数据标准的指导下进行改造,对于不能改造的系统,通过一些技术手段进行清洗转换,在数据产生的环节把控数据质量,这样效率必然是最高的。

数据质量的提升并不是一蹴而就的,做一次数据整改就能解决所有数据质量问题。而是需要通过数据标准和数据质量建立起完善的数据质量管控体系,在各个环节进行监控,定期检查数据质量,确定解决方案,并加以改进。数据质量管理的平台工具,笔者在这里推荐一下亿信华辰的睿治数据治理平台,该平台内置了13中数据质量检查规则,可根据实际需求建立完善的质检方案,精准识别和定位数据质量问题,并可直接关联数据质量整改工作流,帮助企业提升数据质量。质量乃数据之根本,没有质量,数据便不可信,在此之上的数据分析、数据挖掘更是一纸空谈,甚至是大谬论。提升数据质量,建立起可信的企业级大数据势在必行。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 关于数据治理的十件事

    关于数据治理的十件事

    数据治理是我们现在遇到的众多热门词汇之一。有人可能会说这是炒作,但我不这么认为。出于许多好的理由,这是我们的首要考虑,其中一些我们在下面……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:163次

  • 数据治理与组织架构

    数据治理与组织架构

    数据治理实际反映的是组织问题、文化问题,这也是许多公司为了明确权责划分而建立数据治理委员会的原因。同时,还需要明确的程序与执行程序的计划……查看详情

    发布时间:2019.11.01来源:知乎浏览量:134次

  • 数据湖架构 - 最佳实践指南

    数据湖架构 - 最佳实践指南

    实施正确的数据湖架构对于将数据转化为价值至关重要。无论您的数据湖中有多少数据,如果您缺乏有效管理数据、跟踪数据并确保其安全的架构特性,那……查看详情

    发布时间:2021.06.18来源:亿信数据治理知识库浏览量:147次

  • Informatica把AI带到了数据治理、数据治理和数据治理的合规性。

    Informatica把AI带到了数据治理、数据治理和数据治理的合规性。

    随着欧盟制定新隐私规定的最后期限越来越近,企业需要掌握数据的来源。……查看详情

    发布时间:2019.01.09来源:亿信华辰浏览量:143次

  • 数据质量问题根因分析

    数据质量问题根因分析

    说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:245次

  • 十年经验总结:企业物料主数据建设方案

    十年经验总结:企业物料主数据建设方案

    目前很多企业已建立ERP系统,关联到整个企业运营的物料数据仍然存在“一物多码”、“描述不规范”等数据质量问题,这会对企业数据流通共享和经……查看详情

    发布时间:2021.05.21来源:亿信数据治理知识库浏览量:397次

  • 大数据应用与治理

    大数据应用与治理

    不可否认的是,大数据产业很快就要迎来自己的爆发期。经过几年基础建设的培育,技术层面已基本可以满足相关应用,所以行业人士也普遍达成共识,接……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:150次

  • 数据治理流程

    数据治理流程

    要真正把数据作为企业有价值的资产来管理,就必须像管理财务、人力资源等业务功能一样进行数据治理。财务功能由多个核心业务流程组成,如应付账款……查看详情

    发布时间:2019.08.19来源:CSDN浏览量:407次

  • 完善数据治理的制度设计

    完善数据治理的制度设计

    作为最具时代特征、最活跃的生产要素和价值创造来源,“数据”首次出现在《决定》的文本之中。这既反映了经济社会数字化转型不断加快的特征事实,……查看详情

    发布时间:2020.10.31来源:知乎浏览量:122次

  • 数据治理的战略转变

    数据治理的战略转变

    正在进行的思维方式和工具集战略转变正在改变主要思想家如何重新考虑他们的数据治理方法。治理的核心是变革管理。……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:125次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议