数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:207次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据交换管理—企业数据上链的起点

    数据交换管理—企业数据上链的起点

    随着数据体量的增长,大数据处理、大数据应用分析的门槛逐渐提高,社会普遍开始重视数据安全和隐私。目前,数据交换共享平台已成为政府和企业在系……查看详情

    发布时间:2020.08.11来源:知乎浏览量:214次

  • 加强数据治理 护航数字经济

    加强数据治理 护航数字经济

    目前,我国正处在推动互联网、大数据、人工智能和实体经济深度融合的关键时期,个人数据滥采滥用、企业数据交易纠纷频发、公共数据开放开发滞后、……查看详情

    发布时间:2019.01.04来源:陆峰浏览量:138次

  • 电力数据治理方案如何实施?要注意什么?

    电力数据治理方案如何实施?要注意什么?

    电力行业数据治理痛点,包括整体架构缺乏统一的数据中心,孤岛现象严重;数据治理方面缺乏统一的数据标准和数据质量关系;电力数据治理方案如何实……查看详情

    发布时间:2021.04.09来源:亿信数据治理研究院浏览量:763次

  • 试论加强数据治理能力的重要性

    试论加强数据治理能力的重要性

    网络信息资源,是指所有以电子数据形式存储在信息光、磁等非纸质的文字、图像、声音、动画等多种形式的载体中,并通过网络通信、计算机或终端等方……查看详情

    发布时间:2018.12.05来源:网络传播杂志浏览量:192次

  • 数据治理(DG)

    数据治理(DG)

    数据治理(DG)是对企业中使用的数据的可用性,可用性,完整性和安全性的整体管理。健全的数据治理计划包括理事机构或理事会,一套明确的程序和……查看详情

    发布时间:2018.11.12来源:techtarget浏览量:284次

  • 说到数据治理,我们不得不要谈到的要素和落地方法

    说到数据治理,我们不得不要谈到的要素和落地方法

    据戴尔易安信最新调查显示:全球大多数企业现已认识到数据的价值,受管理的平均数据量从2016年的1.45PB增加至2018年的9.70PB……查看详情

    发布时间:2020.06.29来源:CSDN浏览量:189次

  • 如何通过访问控制和强有力的治理使所有级别的数据更易于访问

    如何通过访问控制和强有力的治理使所有级别的数据更易于访问

    支持数据驱动的业务开始了解数据的位置和访问权限。……查看详情

    发布时间:2018.12.25来源:亿信华辰浏览量:144次

  • 数据治理运营:团队

    数据治理运营:团队

    数据治理是人员,流程和技术的结合。……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:284次

  • 数据治理框架:它是什么,我已经拥有它?

    数据治理框架:它是什么,我已经拥有它?

    由于第一个人在第一台计算机上打开了电源开关,IT和业务部门已决定如何处理由技术使用和创建的数据。虽然您不再提交穿孔卡或存档磁带(可能),……查看详情

    发布时间:2018.12.27来源:数据治理浏览量:236次

  • 数据治理那些事儿

    数据治理那些事儿

    业务分析师不得不对IT部门负责,因为他们不知道如何导航信息管理系统数据库,即使他们可以也不会被授予访问权限。IT部门打印出月度报告并分发……查看详情

    发布时间:2019.08.29来源:简书浏览量:198次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议