数据质量及数据质量管理一个较全面的介绍

发布时间:2020.01.09来源:CSDN浏览量:116次标签:数据治理

很多企业数据项目的失败归根结底都是数据质量不高造成的。数据质量不高已经成为困扰此类项目的开发人员与用户的一个严重问题。为了提高大家对数据质量的认识,使企业领导重视数据质量的管理工作,这里对数据质量及数据质量管理做一个较全面的介绍。
数据质量管理
1.何谓数据质量
何谓数据质量可从两个方面来理解:

1.1.数据本身的数据质量
数据的真实性。
数据必须真实准确的反映实际发生的业务。
数据的完备性。
数据的完备性是说数据是充分的,任何有关操作的数据都没有被遗漏。
数据的自洽性。
数据并不是孤立存在的,数据之间往往存在着各种各样的约束,这种约束描述了数据的关联关系。数据必须能够满足这种数据之间的关联关系,而不能够相互矛盾。
数据的真实性、完备性、自洽性是数据本身应具有的属性,称为数据的绝对质量,是保证数据质量的基础。
除了数据的绝对质量外,还有我们在利用和存贮数据的过程中所产生的数据质量,包括使用质量、存贮质量和传输质量,称之为过程质量。

1.2.数据的过程质量
数据的使用质量
数据的使用质量是指数据被正确的使用。再正确的数据,如果被错误的使用,就不可能得出正确的结论。
数据的存贮质量
数据的存贮质量是指数据被安全的存贮在适当的介质上。所谓安全是指采用了适当的方案和技术来抵制外来的因素,使数据免受破坏,备份是我们常使用的技术,包括异地备份和双机备份等,美国的9.11事件和2004年底发生的印度洋海啸事件使越来越多的企业领导意识到备份尤其是异地备份的重要性;所谓存贮在适当的介质上是指当需要数据的时候能及时方便的取出。
数据的传输质量
数据的传输质量是指数据在传输过程中的效率和正确性。在现代信息社会中,数据在异地之间的传输越来越多,保证传输过程中的高效率和正确性非常重要。 

2.数据质量和数据一致性
在工作中我们发现,很多用户甚至一些数据仓库项目的开发人员经常将数据质量和数据仓库项目开发中的ETL过程的数据一致性混为一谈,错误的认为数据仓库项目(也即ETL过程)能够修复数据以提高数据质量,其实数据质量和ETL过程的数据一致性是两个不同的概念。
ETL过程的数据一致性是指根据相同的业务理解(基于源系统模型和基于数据仓库模型),在源系统查询和统计的信息与在数据仓库中得到的结果在各个细节层次(包括明细层次)上都是相同的。数据一致性是ETL过程必须保证的。

数据质量是存在于企业的源系统中的,如常见的客户代码的不规范,同一个客户在不同的系统中(例如业务处理系统和财务系统)有不同的代码,甚至同一个客户在同一个系统中也有不同的代码,以保险公司的业务处理系统为例,同一个客户先后在同一个保险公司投保,不同的业务员可能会输入不同的客户代码;更常见的是那些没有实现大集中的分布式的应用,同一个客户在不同的分公司投保,业务员很可能会输入不同的代码;再如,在业务处理系统中,有些录入人员为了录入的方便,常常将一些内容不输或者采用默认值,造成一些重要录入信息的缺失或错误。这些数据质量问题对我们的数据分析系统造成严重的干扰和破坏。

数据仓库项目虽然不能够修复数据以提高数据质量,但能发现存在的部分问题从而提醒用户哪些数据是有质量问题的,给出用户一些改进的建议,同时在分析和决策时应降低对这些数据的依赖程度,也可以提供辅助的方法跟踪、监测数据质量问题。

3.数据质量的重要性
数据信息是企业重要的战略资源,合理有效的使用正确的数据能指导企业领导作出正确的决策,提高企业的竞争力。不合理的使用不正确的数据(即差的数据质量)可导致决策的失败,正可谓差之毫厘、谬以千里。
现在很多大型企业已意识到数据信息和数据质量的重要性,专门成立了数据中心来管理数据方面的工作。

4.数据质量不高的原因
我们的数据来自于数据录入人员通过信息技术手段(开发计算机处理系统)输入到系统中的,因此数据质量不高来源于下面的两方面:
4.1.信息技术手段
现代信息技术已足以保证数据的存贮和传输质量,不是本文讨论的重点,不过多论述。造成我们的计算机处理系统得到的数据质量不高的原因,很多情况是我们的计算机处理系统的用户界面不友好,不方便用户的录入,或是不符合用户常规的操作习惯,导致用户容易出错或是录入工作量大;对重要的录入信息没有加强效验。
4.2.数据录入人员
由于数据录入人员的输入失误,或是违反操作流程(故意或不是故意的),是造成数据质量不高另一个重要原因。这个问题,可以从两个方面来看待:
数据录入人员的责任心不强和业务素质不高。
基层领导对数据质量的不重视。业务收入是基层的生命线,基层领导不会投入大量的人力和物力来抓数据质量,由于市场竞争的激烈,有时基层领导为了争夺客户甚至会让录入员作出一些违规的操作,基层领导对数据的认识与管理与高层领导对数据的需求形成矛盾,这一矛盾是造成数据质量不高的一个核心矛盾。

5.如何做好数据质量的管理工作
5.1.提高对数据的认识
我们只有认识到数据在管理中的重要作用,才会反过来重视数据质量问题。要让企业的每一个员工都能认识到数据是企业重要的战略资源,企业的一切决策都来源于数据。没有正确的高质量的数据,就没有正确的决策。
5.2.信息技术保证
采用先进的开发技术,开发出用户界面比较友好的系统,减少操作员的录入工作量和出现错误的可能性;同时在开发前要充分考虑用户的需求,防止出现业务处理软件不能满足客户要求、操作员采取违规操作的现象。
开发数据检测、检查工具,及时的发现数据质量问题,及时纠正,要知道,发现问题越早纠正的成本就会越低,一个蚁穴不及时修补会造成千里之的溃决。
5.3.完善的制度管理
在企业上下建立起完善的数据负责制度,并与员工的绩效和奖惩挂钩,有条件的企业可以成立专门的组织和机构负责数据管理工作。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理治的是“数据”吗?

    数据治理治的是“数据”吗?

    数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。其实在我看来,……查看详情

    发布时间:2020.07.07来源:知乎浏览量:93次

  • 数据治理之道是什么,要怎么做?

    数据治理之道是什么,要怎么做?

    数据治理需要体系建设:为发挥数据价值需要满足三个要素:合理的平台架构、完善的治理服务、体系化的运营手段。……查看详情

    发布时间:2021.05.14来源:亿信数据治理知识库浏览量:115次

  • 健康的共同依赖:数据管理和数据治理

    健康的共同依赖:数据管理和数据治理

    现在,数据管理和数据治理比以往任何时候都更加重要。数据驱动业务的超竞争特性意味着组织需要比以往更多地从数据中获得更多 - 而且速度更快。……查看详情

    发布时间:2019.02.15来源:亿信华辰浏览量:121次

  • 大数据时代监管安全的“智慧大脑”

    大数据时代监管安全的“智慧大脑”

    在这里,监控民警不仅是监狱监管安全防线上的眼睛、耳朵、嘴巴,还是视频监控、固证锁证、指挥联动、应急处突的“智慧”大脑。这里就是监狱监管安……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:108次

  • 中小银行行数据治理是否错过最佳建设期?

    中小银行行数据治理是否错过最佳建设期?

    数据治理基础建设缺失、人才匮乏、意识觉醒较晚。目前中小银行数据治理难点有哪些?中小银行行数据治理是否错过最佳建设期。……查看详情

    发布时间:2019.11.28来源:知乎浏览量:91次

  • 探索科学有效的数据治理之路

    探索科学有效的数据治理之路

    数据是数字经济的基础性战略资源,数据治理能力是国家竞争力的体现。随着移动互联网、物联网、云计算等信息技术的飞速发展,人们的生产和生活方式……查看详情

    发布时间:2020.07.31来源:CSDN浏览量:108次

  • 不同部门的数据分析需求,如何满足?

    不同部门的数据分析需求,如何满足?

    让数据驱动落地企业,要先明确商业目的是什么,找到方向才能更好地指导业务。在互联网金融企业中,用户与交易额是各部门工作开展的核心所在。互金……查看详情

    发布时间:2019.01.27来源:亿信华辰浏览量:108次

  • 全球数据治理市场到2024年 - 数据量的增长以提供巨大的机会

    全球数据治理市场到2024年 - 数据量的增长以提供巨大的机会

    预计数据治理市场在预测期间(2019年至2024年)的复合年增长率将超过21.44%,预计到2024年将达到43.5亿美元的价值。 ……查看详情

    发布时间:2019.07.04来源:知乎浏览量:106次

  • 治理:如何做对

    治理:如何做对

    如果您在任何规模的组织中工作,您可能不得不与某种治理委员会打交道。这些都是出了名的狡猾。继续阅读,看看如何避免常见的陷阱。……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:107次

  • 数据治理困难,即数据治理之“困”。

    数据治理困难,即数据治理之“困”。

    当前,以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透。以数据为核心的数字化转型已是大势所趋。金融业是数据密集……查看详情

    发布时间:2020.01.03来源:知乎浏览量:96次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议