数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:169次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 大数据构成挑战?数据治理提供解决方案

    大数据构成挑战?数据治理提供解决方案

    大数据导致许多组织的复杂性,不仅仅是因为他们收集的数据量很大,而是因为他们收集的数据种类繁多。……查看详情

    发布时间:2019.01.23来源:亿信华辰浏览量:130次

  • 数据治理流程

    数据治理流程

    数据治理流程必须通过TSDS数据治理流程审查TEA收集的所有数据。此过程允许用户监督 TEA如何从LEA收集立法规定的数据以及为stud……查看详情

    发布时间:2018.11.27来源:数据治理浏览量:212次

  • 数据治理直击灵魂的四问:治什么?谁来治?怎么治?选哪个?

    数据治理直击灵魂的四问:治什么?谁来治?怎么治?选哪个?

    近些年来,“数据治理”这个词总是高频出现,让人们对其“身世背景”格外好奇。国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系……查看详情

    发布时间:2020.09.19来源:知乎浏览量:131次

  • 从元数据角度来认识大数据

    从元数据角度来认识大数据

    什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数……查看详情

    发布时间:2020.02.21来源:知乎浏览量:177次

  • 中小行纷纷设立数据治理专营部门

    中小行纷纷设立数据治理专营部门

    “数据治理基础建设缺失、人才匮乏、意识觉醒较晚。”一名来参加今日第三届中国数字银行论坛的西部中小银行人士,用了三个并列短句,来形容目前中……查看详情

    发布时间:2019.11.29来源:CSDN浏览量:136次

  • 国内主流的主数据管理方案

    国内主流的主数据管理方案

    主数据管理 (MDM) 是一种能够定义和管理组织中关键数据的全面方法。它提供跨整个企业的一站式可信任数据视图、敏捷的自助服务访问、基于分……查看详情

    发布时间:2020.05.07来源:知乎浏览量:603次

  • 对于制药公司而言,数据治理不应成为吞下难以接受的药物

    对于制药公司而言,数据治理不应成为吞下难以接受的药物

    制药和生命科学公司面临着许多与其他行业相同的数字转型压力,例如我们之前探讨过的金融服务和医疗保健。作为回应,他们正在转向高级分析平台和基……查看详情

    发布时间:2018.12.06来源:迈克尔帕斯托雷浏览量:163次

  • 大数据时代企业为什么需要数据治理吗?

    大数据时代企业为什么需要数据治理吗?

    如今数字化转型正在各行各业中迅速发展,以数据、流量、知识为主大数据时代已经到来,对于一个企业来说,要实施数字花和大数据战略,数据治理更为……查看详情

    发布时间:2019.07.18来源:知乎浏览量:162次

  • 经济社会数字化转型的特征事实

    经济社会数字化转型的特征事实

    联合国、世界贸易组织、经济合作和发展组织、国际货币基金组织等先后于近期发表研究报告,从整体上描述了经济社会数字化转型的特征事实。概括起来……查看详情

    发布时间:2020.10.31来源:知乎浏览量:117次

  • 谈大数据时代下的数据治理

    谈大数据时代下的数据治理

    2013年被众多的IT人定义为中国的大数据元年,这一年国内的大数据项目开始在交通、电信、金融部门被广泛推动。各大银行对Hadoop的规划……查看详情

    发布时间:2019.01.03来源:亿信华辰浏览量:127次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议