数据质量问题根因分析

发布时间:2019.12.06来源:CSDN浏览量:409次标签:数据治理

说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数据质量问题推给技术部门,让技术部门去查找和处理。但是企业的数据质量问题真的都是技术引起的吗,技术部门人一定会说:“这个锅我不背!”

其实,影响数据质量的因素主要就技术、业务、管理三个方面,下面我们就来从这三方面分析下产生数据质量问题都有哪些原因。

技术方面
数据模型设计的质量问题,例如:数据库表结构、数据库约束条件、数据校验规则的设计开发不合理,造成数据录入无法校验或校验不当,引起数据重复、不完整、不准确。
数据源存在数据质量问题,例如:有些数据是从生产系统采集过来的,在生产系统中这些数据就存在重复、不完整、不准确等问题,而采集过程有没有对这些问题做清洗处理,这种情况也比较常见。
数据采集过程质量问题, 例如:采集点、采集频率、采集内容、映射关系等采集参数和流程设置的不正确,数据采集接口效率低,导致的数据采集失败、数据丢失、数据映射和转换失败。
数据传输过程的问题,例如:数据接口本身存在问题、数据接口参数配置错误、网络不可靠等都会造成数据传输过程中的发生数据质量问题。
数据装载过程的问题,例如:数据清洗规则、数据转换规则、数据装载规则配置有问题。
数据存储的质量问题,例如:数据存储设计不合理,数据的存储能力有限,人为后台调整数据,引起的数据丢失、数据无效、数据失真、记录重复。
业务系统各自为政,烟囱式建设,系统之间的数据不一致问题严重。

业务方面
业务需求不清晰,例如:数据的业务描述、业务规则不清晰,导致技术无法构建出合理、正确的数据模型。
业务需求的变更,这个问题其实是对数据质量影响非常大的,需求一变,数据模型设计、数据录入、数据采集、数据传输、数据装载、数据存储等环节都会受到影响,稍有不慎就会导致数据质量问题的发生。
业务端数据输入不规范,常见的数据录入问题,如:大小写、全半角、特殊字符等一不小心就会录错。人工录入的数据质量与录数据的业务人员密切相关,录数据的人工作严谨、认真,数据质量就相对较好,反之就较差。
数据作假,对,你没看错,就是数据作假!操作人员为了提高或降低考核指标,对一些数据进行处理,使得数据真实性无法保证。

管理方面
认知问题。企业管理缺乏数据思维,没有认识到数据质量的重要性,重系统而轻数据,认为系统是万能的,数据质量差些也没关系。
没有明确数据归口管理部门或岗位,缺乏数据认责机制,出现数据质量问题找不到负责人。
缺乏数据规划,没有明确的数据质量目标,没有制定数据质量相关的政策和制度。
数据输入规范不统一,不同的业务部门、不同的时间、甚至在处理相同业务的时候,由于数据输入规范不同,造成数据冲突或矛盾。
缺乏有效的数据质量问题处理机制,数据质量问题从发现、指派、处理、优化没有一个统一的流程和制度支撑,数据质量问题无法闭环。
缺乏有效的数据管控机制,对历史数据质量检查、新增数据质量校验没有明确和有效的控制措施,出现数据质量问题无法考核。

小结:影响数据质量的因素,可以总结为两类,客观因素和主观因素。客观因素:在数据各环节流转中,由于系统异常和流程设置不当等因素,从而引起的数据质量问题。主观因素:在数据各环节处理中,由于人员素质低和管理缺陷等因素,从而操作不当而引起的数据质量问题。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 一张架构图告诉你数据中台如何搭建

    一张架构图告诉你数据中台如何搭建

    当下,刮起了一场数据中台风,立马席卷了大数据行业的各个角落。人人都在谈什么是数据中台,我们需不需要建数据中台,数据中台要怎么建?今天,小……查看详情

    发布时间:2020.10.15来源:数据中台浏览量:198次

  • 什么是数据治理?为何数据治理如此重要?

    什么是数据治理?为何数据治理如此重要?

    如我们所见,数据正在以前所未有的速度增长,IDC曾发布报告称,到2025年,全球数据圈预计将增长至175 ZB。如何在这样一个数据大爆发……查看详情

    发布时间:2020.03.26来源:知乎浏览量:188次

  • 2句话告诉你什么是数据治理

    2句话告诉你什么是数据治理

    数据治理是实践和流程的集合,有助于确保组织内数据资产的正式管理。数据治理通常包括其他概念,例如数据管理,数据质量等,以帮助企业更好地控制……查看详情

    发布时间:2021.04.28来源:亿信数据治理知识库浏览量:184次

  • 数据治理:收集表单数据的最佳实践

    数据治理:收集表单数据的最佳实践

    什么是数据治理以及它与您的组织有什么关系?……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:169次

  • 为什么组织需要可靠的数据治理策略

    为什么组织需要可靠的数据治理策略

    数据管理已经从仅由IT部门访问的集中数据发展为存储在数据仓库中的大量数据。输入数据治理。……查看详情

    发布时间:2019.01.17来源:数据治理浏览量:203次

  • 6个实施数据治理的最佳实践方法

    6个实施数据治理的最佳实践方法

    在寻找数据治理最佳实施方法时,您可以从已有的各种流程和模板工作的人那里学到很多东西。尽管每个企业都不同,您将需要根据流程调整数据治理实践……查看详情

    发布时间:2021.07.28来源:亿信数据治理知识库浏览量:268次

  • 数据质量管理策略-从产生数据的源头开始抓

    数据质量管理策略-从产生数据的源头开始抓

    为了改进和提高数据质量,必须从产生数据的源头开始抓起,从管理入手,对数据运行的全过程进行监控,密切关注数据质量的发展和变化,深入研究数据……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:238次

  • 国内成熟的数据治理解决方案提供商

    国内成熟的数据治理解决方案提供商

    如今,数据已成为企业的货币,但管理数据不当可能会很快失去控制。麻省理工学院最近的一项研究发现,对于一些企业来说,大数据正在变成糟糕的数据……查看详情

    发布时间:2019.11.25来源:CSDN浏览量:247次

  • 数据治理—构建你的数据屏障

    数据治理—构建你的数据屏障

    在快速发展的技术,大数据和高级分析的时代,数据治理在每个组织中都发挥着至关重要的作用,无论规模大小或行业如何。从定义元数据管理指南,到解……查看详情

    发布时间:2019.06.28来源:知乎浏览量:187次

  • 实施数据治理 - 学到3个主要经验教训

    实施数据治理 - 学到3个主要经验教训

    尽管数据治理在开发过程中可能会有些流动和迭代,但遵循最佳实践并设计精心定位的路线图有助于确保成功。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:251次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议