企业数据质量是数字化时代企业的重要资产

发布时间:2020.01.10来源:知乎浏览量:208次标签:数据治理

大数据的概念正在进一步渗透到各个行业与领域当中,随着企业业务增长和规模扩大,以及伴随着信息技术和相关基础设施的不断完善,在短短的几年内,数据已经呈现了爆发式的增长,多数传统企业也开始走上了数字化转型的道路。数据中蕴藏的商业价值也逐渐被人们挖掘出来:客户群体细分提供个性化服务和精准营销、数据驱动创新促进发掘新的需求和商业模式、数据互联互通打破了组织边界提高管理效率和产业效率,以及降低服务成本。

企业数据质量
数据是数字化时代企业的重要资产,数据可以以产品或服务的形态为企业创造价值。既然数据可以是产品、可以是服务,那问题就简单了。虽然数据质量管理没有成熟方法论支撑,但是产品和服务的质量管理体系却已非常的成熟了,何不尝试用产品和服务的质量管理体系来管理数据质量?!那国际上最权威的质量管理体系IOS9001是否也适用于企业的数据质量管理呢?

数据治理方面,不论是国际的还是国内的,我们能找到很多数据治理成熟度评估模型这样的理论框架,作为企业实施的指引。而说到数据质量管理的方法论,其实业内还没有一套科学、完整的数据质量管理的体系。很多企业对数据质量的重视程度还不够,即使部分企业在朝着这个方向努力,也是摸着石头过河。

下图是ISO9001基于PDCA的质量管理核心思想,其重点强调以客户为关注焦点、领导作用、全员参与、过程方法、持续改进、循证决策和关系管理。

依据ISO9001以及企业在数据治理方面的相关经验,亿信华辰认为企业数据质量管理应从以下几个方面着手:

1. 明确目标
这里先提一个概念:数据生命周期管理。数据的生命周期从数据规划开始,中间是一个包括产生、处理、部署、应用、监控、存档、销毁这几个步骤并不断迭代的过程。那么在其中任何一个环节都会涉及到数据质量的管理。因此当我们确定此次数据质量评估的目标时,首先要定位当前的数据处于生命周期的哪个阶段,进一步明确后续步骤对于数据质量的需求有哪些。数据价值的体现形式在于数据通过流动最终被消费。同一份数据在不同的生命周期中,其质量的关注点是存在差异的,因此很重要的一点就是明确当前阶段数据质量管理的目标是什么。有了明确的目标,才能开始对数据进行合理的评估。

2. 构建数据全景图
许多企业进行数据质量评估的时候很容易只关注在当前企业的现有数据。从而忽视了当前企业中暂时没有的数据。我们知道,数据可以划分为内部数据和外部数据,还可以通过数据交易获取数据。因此对于数据质量管理,很重要的一点就是企业首先要构建一个数据全景图。基于生态或者完整的业务全景来构建数据全景。数据全景图与业务是不可分离的,因此,脱离了业务,或者仅仅围绕部分当前的业务进行质量的评估,并不能从长远和全局的角度给我们的数据质量管理带来更加价值的指导意义。既要关注当下的现状,又要着眼于未来的演变。

3. 选取数据质量维度
评价数据质量的维度有很多,例如:数据准确性、数据一致性、数据的实效性、数据的完整性等等。可列举出十几种维度或者更多,在许多地方都会有对数据质量维度的具体解释。那么在这里我们要关注的是如何选取维度。尽管每一个维度都与质量相关联,但是并不是每一个维度对质量都会产生相同的影响作用。因此,我们需要对选取几个我们最为关注的数据质量维度来对其进行评估。选取过多的维度会增加后续数据质量评估模型的复杂度,并会增加采样数据,度量质量的成本和难度。而选取过少的维度又不能全面的反应数据质量。一般来说,4-7个维度是比较合理的选择。当然,根据实际需要,也可以定义自己的质量维度和选取适当的数量。

4. 制定数据质量评估模型
经过上一步选定了进行质量度量的维度,接下来就是对数据评估进行建模。建模的目的是我们在对各个维度进行质量度量之后,需要对度量结果进行一个计算,得到一个更加直观的分数来衡量数据质量的好坏。建模本身也是一个复杂的工程,当然简单的评估模型可以是一个线性模型,既各个维度的数值乘以一个权重然后进行累加。也可以是一个很复杂的数学模型,甚至会对模型进行调参。建模本身需要对数据有一定敏感性和深刻的理解,同时需要具备一定的数学知识。

5. 确定数据质量度量标准和度量方法
在数据质量的众多维度当中,有些维度是很容易进行度量的,例如缺失率。缺失率的计算只要统计出缺失的数据量在整个数据集中的占比就可以得出一个具体的值。然而有些维度,例如实效性、一致性等如果要进行度量的话,就不是那么容易了。我们需要在度量之前定义出度量的标准是什么,基于这个标准,再确定度量的方法。就是我们如何把一些描述性的度量全部转化成为可以量化的数值或者比率。需要这样一个量化的过程,才能够将这些度量结果通过模型计算,最终得出一个质量的评估结果。度量的方法也会分为多种,可以是人工去对比,也可以用程序化的方式进行对比,或者采用统计学的方式来进行度量。

6. 实施数据质量评估并撰写评估报告
终于到了最后的实施环节,在实施的环节需要考虑的是数据采样策略。如果数据量小,我们可以对全部数据进行度量和评估。如果数据量很大或者对全量数据进行评估成本过高,那么就需要进行部分数据采样,对样本数据进行评估。数据会有其自身的一些特点,例如周期性或者实效性。因此在制定抽样策略和抽样频率的时候,不能不考虑这些因素,否则采样数据得出的评估结论很可能就会与全量数据的真实情况有较大的偏差,因此如何尽可能的减少偏差也是一个需要思考的问题。

经过抽样、度量、评估之后,就可以得到评估结论了。最后我们需要的就是撰写一份评估的报告,在这份报告当中,除了最后的结论,应当还包括对这个结论的分析和解读,并通过一些可视化的方式展现在报告当中。数据质量评估报告不是最终的目的,这份报告对后续数据质量的管理,数据治理等都具有非常重要的参考意义。因此,在这份报告中应当包含结论、分析以及只质量改善建议这几个方面。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业必须使其数据治理程序适应数据爆炸和颠覆性技术的现实

    企业必须使其数据治理程序适应数据爆炸和颠覆性技术的现实

    公司必须使其数据治理计划适应数据爆炸和颠覆性技术的现实 今天的数据爆炸 - 以及所揭示的见解 - 不仅从战略角度对组织非常有价值,而且……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:172次

  • 做好大数据治理才能建设好大数据平台

    做好大数据治理才能建设好大数据平台

    数据量不断的增加,对数据分析和管理带来了挑战,分析数据背后的价值也为企业发展,社会进步带来了机遇。因此各行各业开始建设大数据平台,大数据……查看详情

    发布时间:2019.08.15来源:知乎浏览量:206次

  • 数据治理框架:它是什么,我已经拥有它?

    数据治理框架:它是什么,我已经拥有它?

    由于第一个人在第一台计算机上打开了电源开关,IT和业务部门已决定如何处理由技术使用和创建的数据。虽然您不再提交穿孔卡或存档磁带(可能),……查看详情

    发布时间:2018.12.27来源:数据治理浏览量:243次

  • 医院管理局治理最佳实践

    医院管理局治理最佳实践

    新技术几乎融入了医院运营,领导和治理的各个方面。医院董事会将不考虑医院治理最佳实践还需要探索数字软件解决方案,例如董事会门户系统,以支持……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:176次

  • 数据治理VS数据安全治理

    数据治理VS数据安全治理

    企业信息化建设是随着企业战略、业务形态、预算等多个方面不断迭代及变化的,所以在建设过程中难免出现阶段鸿沟,跨阶段整合难的现象,当企业以数……查看详情

    发布时间:2020.06.29来源:CSDN浏览量:195次

  • 大数据时代下金融数据治理的问题

    大数据时代下金融数据治理的问题

    数据治理是一套完整的制度、指引和规范,用于统筹人员、流程以及技术等要素,使得商业银行能将数据作为企业的重要资产而有效利用,其核心内容是统……查看详情

    发布时间:2019.10.17来源:知乎浏览量:233次

  • 数据治理的未来:平衡数据治理和数据管理

    数据治理的未来:平衡数据治理和数据管理

    如何通过快速访问高质量数据,灌输信心并支持数据驱动的决策,为业务合作伙伴创造竞争优势?在为所有CitizenBank的企业数据创建和实施……查看详情

    发布时间:2018.12.27来源:亿信华辰浏览量:197次

  • 数据治理的应用指南——亿信华辰

    数据治理的应用指南——亿信华辰

    数据治理(有时也称为IT治理)是存储管理的关键部分。显然,IT治理总体上与数据治理密切相关:IT是任何数据治理项目的组成部分。……查看详情

    发布时间:2019.02.13来源:亿信华辰浏览量:253次

  • 数据治理的重点领域:关注数据质量

    数据治理的重点领域:关注数据质量

    由于数据质量,完整性或可用性方面的问题,这种类型的程序通常会出现。……查看详情

    发布时间:2019.03.29来源:亿信华辰浏览量:247次

  • 不要欺骗自己关于数据管理

    不要欺骗自己关于数据管理

    采用数据战略的早期阶段通常涉及数据管理的临时方法。企业不是投资于一套新工具,而是倾向于使用已经完成的工作,从小规模开始并最终形成方法。……查看详情

    发布时间:2019.02.25来源:亿信华辰浏览量:186次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议