数据质量问题根因分析

发布时间:2019.12.06来源:CSDN浏览量:24次标签:数据治理

说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数据质量问题推给技术部门,让技术部门去查找和处理。但是企业的数据质量问题真的都是技术引起的吗,技术部门人一定会说:“这个锅我不背!”

其实,影响数据质量的因素主要就技术、业务、管理三个方面,下面我们就来从这三方面分析下产生数据质量问题都有哪些原因。

技术方面
数据模型设计的质量问题,例如:数据库表结构、数据库约束条件、数据校验规则的设计开发不合理,造成数据录入无法校验或校验不当,引起数据重复、不完整、不准确。
数据源存在数据质量问题,例如:有些数据是从生产系统采集过来的,在生产系统中这些数据就存在重复、不完整、不准确等问题,而采集过程有没有对这些问题做清洗处理,这种情况也比较常见。
数据采集过程质量问题, 例如:采集点、采集频率、采集内容、映射关系等采集参数和流程设置的不正确,数据采集接口效率低,导致的数据采集失败、数据丢失、数据映射和转换失败。
数据传输过程的问题,例如:数据接口本身存在问题、数据接口参数配置错误、网络不可靠等都会造成数据传输过程中的发生数据质量问题。
数据装载过程的问题,例如:数据清洗规则、数据转换规则、数据装载规则配置有问题。
数据存储的质量问题,例如:数据存储设计不合理,数据的存储能力有限,人为后台调整数据,引起的数据丢失、数据无效、数据失真、记录重复。
业务系统各自为政,烟囱式建设,系统之间的数据不一致问题严重。

业务方面
业务需求不清晰,例如:数据的业务描述、业务规则不清晰,导致技术无法构建出合理、正确的数据模型。
业务需求的变更,这个问题其实是对数据质量影响非常大的,需求一变,数据模型设计、数据录入、数据采集、数据传输、数据装载、数据存储等环节都会受到影响,稍有不慎就会导致数据质量问题的发生。
业务端数据输入不规范,常见的数据录入问题,如:大小写、全半角、特殊字符等一不小心就会录错。人工录入的数据质量与录数据的业务人员密切相关,录数据的人工作严谨、认真,数据质量就相对较好,反之就较差。
数据作假,对,你没看错,就是数据作假!操作人员为了提高或降低考核指标,对一些数据进行处理,使得数据真实性无法保证。

管理方面
认知问题。企业管理缺乏数据思维,没有认识到数据质量的重要性,重系统而轻数据,认为系统是万能的,数据质量差些也没关系。
没有明确数据归口管理部门或岗位,缺乏数据认责机制,出现数据质量问题找不到负责人。
缺乏数据规划,没有明确的数据质量目标,没有制定数据质量相关的政策和制度。
数据输入规范不统一,不同的业务部门、不同的时间、甚至在处理相同业务的时候,由于数据输入规范不同,造成数据冲突或矛盾。
缺乏有效的数据质量问题处理机制,数据质量问题从发现、指派、处理、优化没有一个统一的流程和制度支撑,数据质量问题无法闭环。
缺乏有效的数据管控机制,对历史数据质量检查、新增数据质量校验没有明确和有效的控制措施,出现数据质量问题无法考核。

小结:影响数据质量的因素,可以总结为两类,客观因素和主观因素。客观因素:在数据各环节流转中,由于系统异常和流程设置不当等因素,从而引起的数据质量问题。主观因素:在数据各环节处理中,由于人员素质低和管理缺陷等因素,从而操作不当而引起的数据质量问题。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据资产管理“管”什么

    数据资产管理“管”什么

    目前,数据资产管理已经形成了一套科学的管理架构体系,其体系架构如下图所示,主要包含9个活动职能和2个保障措施,9个活动职能指的是数据标准……查看详情

    发布时间:2020.09.11来源:知乎浏览量:14次

  • 如何构建我国的数据治理体系

    如何构建我国的数据治理体系

    公司应该考虑它是否有数据治理政策,如果有,是否全面有效。数据治理政策已成为监管期望,作为核心质量体系政策之一。企业应根据对流程的理解和技……查看详情

    发布时间:2019.08.16来源:知乎浏览量:26次

  • 数据治理成功的预测指标

    数据治理成功的预测指标

    简而言之,数据治理项目在组织内经常遇到的挑战通常与高级管理层和业务中的数据文化状态密切相关。从这两个利益相关方团体获得支持可以显着提高数……查看详情

    发布时间:2019.03.22来源:亿信华辰浏览量:19次

  • 数据治理不仅仅是合规问题,它还是一项好业务

    数据治理不仅仅是合规问题,它还是一项好业务

    由于数据的重要性日益增加以及各种数据法规的实施,有效的数据治理策略对业务至关重要。……查看详情

    发布时间:2019.01.17来源:亿信华辰浏览量:14次

  • 大数据环境下数据质量管理面临的挑战

    大数据环境下数据质量管理面临的挑战

    随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:12次

  • 企业实现一个数据治理的项目需要注意什么?

    企业实现一个数据治理的项目需要注意什么?

    数据治理是长期、复杂的工程,每个数据治理的领域都可作为一个独立方向进行研究,目前总结的数据治理领域包括但不限于以下内容:数据标准、数据模……查看详情

    发布时间:2020.03.26来源:知乎浏览量:12次

  • 数据治理要“三化”

    数据治理要“三化”

    “数据是新的‘石油’。在智能化、数字化大潮下,只有对大数据进行有效、高质量治理,才能将数据“原油”转变为有价值有质量的数据“石油”,从而……查看详情

    发布时间:2019.11.29来源:知乎浏览量:13次

  • 商业银行数据治理从源头抓起 坚持数据标准先行

    商业银行数据治理从源头抓起 坚持数据标准先行

    商业银行数据治理是一门将数据视为一项资产的学科。它涉及到银行以资产的形式对数据进行优化、保护和利用的决策权利。糟糕的数据管理意味着糟糕的……查看详情

    发布时间:2019.09.04来源:知乎浏览量:22次

  • 数据中台不等于大数据平台-数据中台价值

    数据中台不等于大数据平台-数据中台价值

    数据中台不等于大数据平台,数据中台的核心工作也并不是将企业的数据全部收集起来做汇总就够了。数据中台的使命是利用大数据技术、通过全局规划来……查看详情

    发布时间:2020.11.21来源:知乎浏览量:36次

  • 数据治理中如何做好数据清理与归档

    数据治理中如何做好数据清理与归档

    传统上,数据的清理和归档属于DBA的职责,随着企业数字化转型、数据治理工作的推进,这项工作也被纳入了数据治理工作的重要内容。数据团队定期……查看详情

    发布时间:2022.05.31来源:互联网浏览量:55次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议