数据质量问题分析

发布时间:2019.01.07来源:亿信华辰浏览量:174次标签:数据治理


数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。

1、技术问题

由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:

数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;

数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;

数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;

2、信息问题

由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。

元数据描述及理解错误中的相关元数据主要包括:

业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;

技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。

数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。

3、流程问题

由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:

创建流程质量问题主要指操作员数据录入时缺乏审核流程;

传递流程质量问题主要指通信流程沟通不畅;

装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;

使用流程质量问题主要指数据使用流程缺乏流程管理;

维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;

4、管理问题

由于人员素质及管理机制方面的 原因 造成的数据质量问题如:

数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。

人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。

没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责

没有明确的数据质量目标;

缺少管理数据质量的管理办法等。

此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理理论

    数据治理理论

    数据治理是对数据资产的管理行使权力和控制的活劢集合(规划、监控和执行)。数据治理职能指导其他数据管理职能如何执行。……查看详情

    发布时间:2019.08.27来源:知乎浏览量:340次

  • 如何保证数据质量、数据治理:让数据质量更好

    如何保证数据质量、数据治理:让数据质量更好

    数据分析、数据挖掘等各种数据应用都离不开数据质量,数据质量的重要性不用多表。今天来浅谈如何通过数据治理,来保证数据质量。数据的生命周期往……查看详情

    发布时间:2019.09.12来源:知乎浏览量:196次

  • 数据治理的注意事项

    数据治理的注意事项

    我看到组织在开始他们的数据治理之旅时犯的一个重大错误就是忘记了数据背后的基本原理。因此,不要仅仅治理治理。无论您是需要将风险降至最低还是……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:171次

  • 数据治理成功的预测指标

    数据治理成功的预测指标

    简而言之,数据治理项目在组织内经常遇到的挑战通常与高级管理层和业务中的数据文化状态密切相关。从这两个利益相关方团体获得支持可以显着提高数……查看详情

    发布时间:2019.03.22来源:亿信华辰浏览量:187次

  • 数据治理方法 | 美国高校数据治理方法借鉴

    数据治理方法 | 美国高校数据治理方法借鉴

    高等教育中的数据治理是一种风险管理工具,可促进家庭教育和监管合规性,因为它旨在保护隐私和敏感信息。最后,数据是一种资产,如果使用得当,可……查看详情

    发布时间:2021.06.02来源:亿信华辰数据治理知识库浏览量:150次

  • 数据治理是任何自助分析和数据发现策略的重要组成部分

    数据治理是任何自助分析和数据发现策略的重要组成部分

    当越来越多的用户与越来越多的数据交互并可视化时,可靠的治理实践可以确保每个利益相关者都能获得他们所需的洞察力,同时完全保留数据源的及时性……查看详情

    发布时间:2019.01.17来源:数据治理浏览量:170次

  • 数据要素跑步入场,如何构建大数据治理体系?

    数据要素跑步入场,如何构建大数据治理体系?

    通俗来说,数据治理就是预防、诊断和治疗与数据有关的一切“病症”。亿信华辰智能数据治理平台——“睿治”就是根治病症的良药。……查看详情

    发布时间:2021.05.13来源:亿信数据治理知识库浏览量:203次

  • 企业级数据治理面临的挑战与对策

    企业级数据治理面临的挑战与对策

    数据治理是社会深度信息化的产物,显示数据正从独占转为共享、从封闭走向开放、从权力变成资源的趋势。目前国内外对其有多种定义,如数据治理是对……查看详情

    发布时间:2019.08.20来源:知乎浏览量:268次

  • 新白皮书提供数据治理计划实施技巧

    新白皮书提供数据治理计划实施技巧

    实施数据治理计划 - 一系列标准化管理实践,以解决数据的创建,使用和报告问题 - 有助于确保医疗保健组织内的大量数据得到质量,可访问性和……查看详情

    发布时间:2018.11.21来源:数据治理浏览量:166次

  • 数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外…………查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:144次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议