数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:177次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 业务流程建模及其在企业中的作用

    业务流程建模及其在企业中的作用

    为实现其目标,组织必须完全了解其流程。因此,业务流程设计和分析是定义业务运营方式的关键,并确保员工理解并负责履行其职责。……查看详情

    发布时间:2019.02.18来源:亿信华辰浏览量:247次

  • 数据治理和数据管理推动成功的词汇表和词典

    数据治理和数据管理推动成功的词汇表和词典

    任何数据管理员的噩梦都是运行会议,创建迂腐和无关的业务词汇表或数据词典,最终收集网络粉尘。但是,跳过构建和维护良好的业务术语表或数据字典……查看详情

    发布时间:2018.12.27来源:亿信华辰浏览量:157次

  • 数据建模和数据映射:来自任何数据的结果

    数据建模和数据映射:来自任何数据的结果

    统一的数据建模和数据映射方法可能是许多数据驱动型组织所需要的突破。在我与客户进行的大多数对话中,他们表示需要一个可行的解决方案来模拟他……查看详情

    发布时间:2019.01.17来源:亿信华辰浏览量:257次

  • 数据治理的全球难题:法治化治理如何跟上技术更新步伐?

    数据治理的全球难题:法治化治理如何跟上技术更新步伐?

    随着技术的发展,需要治理的已不只是数据,人工智能算法等领域也成为治理课题。数据、互联网平台、人工智能算法应该如何治理?这在全球范围内都是……查看详情

    发布时间:2019.10.25来源:知乎浏览量:133次

  • 大数据治理背景现状以及策略

    大数据治理背景现状以及策略

    随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长。大约每两年翻一番,根据监测,这个速度在2020 年之前会继续保持下去。这……查看详情

    发布时间:2018.12.07来源:物联网世界浏览量:294次

  • 什么是数据标准?如何制定数据标准?这份指南送上

    什么是数据标准?如何制定数据标准?这份指南送上

    随着大数据行业的兴起,数据的重要性不言而喻,对数据进行应用的工具层出不穷,带来了巨大的经济效益。可很快就发现了诸多数据问题,制约了数据应……查看详情

    发布时间:2020.10.24来源:知乎浏览量:171次

  • 谈谈数据治理是什么?

    谈谈数据治理是什么?

    数据治理这项工作一直都是存在的,和数据库设计的三范式一样都是为了数据的管理。数据治理是一整套完整的组织、制度、技术管理行为。……查看详情

    发布时间:2021.03.06来源:人人都是产品经理浏览量:172次

  • 企业数据治理的实际步骤

    企业数据治理的实际步骤

    数据治理是一项业务活动。到目前为止,已经有多项努力从IT内部开始。但是,数据属于业务,而不属于IT。IT可以提供建议,帮助管理存储库,提……查看详情

    发布时间:2018.11.20来源:数据治理浏览量:144次

  • 提升数据治理能力,构筑共治共享行业新生态

    提升数据治理能力,构筑共治共享行业新生态

    夯实数据治理之基,构筑良好的银行业数字化生态,数据治理构建开放的金融新生态,数据治理数据已成为银行业未来致胜的核心“资产”和竞争力。……查看详情

    发布时间:2020.01.03来源:知乎浏览量:259次

  • 数据治理和风险管理

    数据治理和风险管理

    风险管理对于任何数据驱动的业务都至关重要。前联邦调查局局长罗伯特·穆勒(Robert Mueller)曾说过,“只有两种类型的公司:那些……查看详情

    发布时间:2019.01.27来源:亿信华辰浏览量:167次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议