数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:172次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理需要转变

    数据治理需要转变

    数据准备和编目工具使用机器学习来协助和建议采购,策划,挖掘和使用数据的方法。数据治理服务在后台智能运行,以自动更正和管理数据使用。……查看详情

    发布时间:2019.04.03来源:亿信华辰浏览量:149次

  • 浅析数据治理与数据安全治理的概念差异

    浅析数据治理与数据安全治理的概念差异

    当我们谈到数据资产的时候,想到最多的就是数据治理,接下来就是数据安全治理,那么这两者之间有什么区别和差异呢?……查看详情

    发布时间:2019.08.14来源:知乎浏览量:248次

  • 什么是元数据?为何需要元数据?

    什么是元数据?为何需要元数据?

    元数据是对我们整个系统里面包含的各种结构的描述和说明,比如结构说明、属性说明、或者相关数据,它有点类似现实世界中我们使用的某个产品的说明……查看详情

    发布时间:2019.09.09来源:知乎浏览量:187次

  • 打破数据治理:数据质量

    打破数据治理:数据质量

    任何数据驱动的计划的成功取决于该数据是否相关且值得信赖。随着越来越多的大学将数据视为负责任的战略规划和计划的关键,许多人都意识到:有些数……查看详情

    发布时间:2019.07.11来源:知乎浏览量:171次

  • 实施数据治理项目是企业数字化转型的基础

    实施数据治理项目是企业数字化转型的基础

    企业数字化转型趋势是“数据”引领业务变革,数据集中管控成为大势所趋,如何做好数据共享和数据分析、如何发挥数据资产价值最大化是我们信息化工……查看详情

    发布时间:2019.10.22来源:知乎浏览量:168次

  • 数据质量在数据治理中的重要意义

    数据质量在数据治理中的重要意义

    数据的质量问题从一定的角度反映出组织当中存在的一些问题,而问题的来源可能是数据流动,可能业务流程也可能源于管理问题等等,数据质量问题的分……查看详情

    发布时间:2020.01.10来源:CSDN浏览量:170次

  • 如何应对数据标准化的难题

    如何应对数据标准化的难题

    数据标准好制定,但是数据标准落地相对就困难多了。国内的数据标准化工作发展了那么多年,各个行业,各个组织都在建设自己的数据标准,但是你很少……查看详情

    发布时间:2019.12.20来源:知乎浏览量:155次

  • 企业架构框架和元模型,指南

    企业架构框架和元模型,指南

    与任何建筑或基础设施项目需要不同的利益相关者和不同的计划视图的方式大致相同,企业架构(EA)也需要相同。……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:241次

  • 深度思考:从BERT看大规模数据的无监督利用

    深度思考:从BERT看大规模数据的无监督利用

    在击败 11 个 NLP 任务的 State-of-the-art 结果之后,BERT 成为了 NLP 界新的里程碑, 同时打开了新的思……查看详情

    发布时间:2019.02.20来源:亿信华辰浏览量:284次

  • 数据治理和安全

    数据治理和安全

    从组织的角度来看,通过人力资源技术传递的数据需要尽可能保持清洁,一致和可转移。问题?多个系统,手动流程和其他低效率需要清理脏数据,稍后从……查看详情

    发布时间:2018.12.04来源:数据治理浏览量:231次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议