数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:211次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 当下数据治理是多么的重要

    当下数据治理是多么的重要

    公司有大量数据来自外部,更多数据在内部创建或更新,因此数据可能应该“受到管理”,因此您可以拥有良好的数据。数据治理是一组流程,可确保在整……查看详情

    发布时间:2019.09.04来源:知乎浏览量:205次

  • 11个顶级数据治理平台

    11个顶级数据治理平台

    虽然许多组织更加重视他们的数据治理计划,但“大多数企业都会在企业数据治理方面遇到困难,而他们最初只关注客户,供应商或产品,”MDM研究所……查看详情

    发布时间:2018.11.16来源:David Weldon浏览量:830次

  • 什么是自适应数据分析和数据治理?

    什么是自适应数据分析和数据治理?

    自适应数据和分析治理,这种方法可帮助企业保持相关性并响应组织内部和外部的快速变化的环境。在自适应数据和分析治理中,数据治理不仅仅是约束和……查看详情

    发布时间:2021.06.02来源:亿信华辰数据治理知识库浏览量:180次

  • 如今企业面临哪些数据湖管理挑战?

    如今企业面临哪些数据湖管理挑战?

    成功的数据治理方案涉及部署策略、标准和流程,以在整个企业中有效正确地利用高质量数据。如果你的企业具有数据湖环境,并希望从中获得高质量的分……查看详情

    发布时间:2020.04.02来源:知乎浏览量:189次

  • 了解当今数据驱动型企业的治理核心

    了解当今数据驱动型企业的治理核心

    数据治理不仅涉及风险管理。它是关于深入了解数据的核心,使组织中的每个人都能更轻松地使用和信任数据,从而获得业务优势。良好的数据治理系统不……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:190次

  • 如何保证所基于的数据具有高质量?

    如何保证所基于的数据具有高质量?

    基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及……查看详情

    发布时间:2020.10.31来源:知乎浏览量:181次

  • 数据治理成功要素:制定数据质量管理办法及标准

    数据治理成功要素:制定数据质量管理办法及标准

    数据质量管理是指为了满足信息系统的需要,对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,……查看详情

    发布时间:2022.02.25来源:小亿浏览量:370次

  • 数据标准管理平台解决方案

    数据标准管理平台解决方案

    企业内部开展企业数据资源整合工作,实现对企业核心业务、核心资源的综合管控,是企业信息化的一个核心目标。通过体系化的数据资源管理平台的建设……查看详情

    发布时间:2020.04.28来源:知乎浏览量:233次

  • 应用程序组合管理:优化您的投资组合

    应用程序组合管理:优化您的投资组合

    过程的第四个也是最后一个阶段是优化您的投资组合,在这里您必须开始检查其他应用程序和项目之间的依赖关系。您还必须在每个应用程序中添加成本和……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:181次

  • 大数据环境下我国政府数据开放及应用研究

    大数据环境下我国政府数据开放及应用研究

    在当前政府各项工作开展过程中, 政府数据管理属于十分重要的一项任务及内容, 对于政府各项政务工作的开展均具有十分重要的作用及意义。……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:146次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议