数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:178次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 为什么数据治理很重要

    为什么数据治理很重要

    尽管许多企业的数据治理在被不经意间悄悄地忽视了,只有48%的企业拥有明确的规划或计划,但这并不影响数据治理的重要性,它聚焦于三个关键因素……查看详情

    发布时间:2020.07.10来源:CSDN浏览量:139次

  • 数据交换管理—企业数据上链的起点

    数据交换管理—企业数据上链的起点

    随着数据体量的增长,大数据处理、大数据应用分析的门槛逐渐提高,社会普遍开始重视数据安全和隐私。目前,数据交换共享平台已成为政府和企业在系……查看详情

    发布时间:2020.08.11来源:知乎浏览量:133次

  • 数据治理的定义:什么是数据治理?

    数据治理的定义:什么是数据治理?

    数据治理(DG)是增长最快的学科之一,但在定义数据治理方面,许多组织都在努力。 Dataversity称DG是“有助于确保组织内数据资……查看详情

    发布时间:2018.11.15来源:Zak Cole浏览量:154次

  • 红树林社会:从数字创新到数字治理

    红树林社会:从数字创新到数字治理

    这种情况就在我们身边,证明了数字化对日常生活的影响以及如何对其进行规范。……查看详情

    发布时间:2019.03.20来源:亿信华辰浏览量:114次

  • 企业架构组织的创新能力如何?

    企业架构组织的创新能力如何?

    回想一下最新的企业架构文章,博客文章,甚至是你读过的职位描述,并算一下至少一次没有提到“创新”的内容?我猜测,“创新”往往被作为有效企业……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:124次

  • 让数据清澈如水:数据清洗的策略与方法

    让数据清澈如水:数据清洗的策略与方法

    在数据仓库中,数据是面向某一主题的数据的集合,这些数据从多个业务系统抽取而来,不同的数据来源加上历史数据的堆积,难免会有问题数据出现,这……查看详情

    发布时间:2020.11.23来源:亿信华辰浏览量:184次

  • 什么是数据孤岛?为什么要消除数据孤岛?

    什么是数据孤岛?为什么要消除数据孤岛?

    数据孤岛通常具有负面含义。它描述了孤立的数据岛,数据孤岛通常存在以下问题:1.由于代码较旧或不兼容而无法以编程方式与其他系统一起工作2.……查看详情

    发布时间:2021.05.28来源:亿信数据治理知识库浏览量:376次

  • 数据标准化的难题

    数据标准化的难题

    数据标准好制定,但是数据标准落地相对就困难多了。国内的数据标准化工作发展了那么多年,各个行业,各个组织都在建设自己的数据标准,但是你很少……查看详情

    发布时间:2019.12.20来源:知乎浏览量:122次

  • 一文搞懂数据质量问题及对应的解决办法

    一文搞懂数据质量问题及对应的解决办法

    通过数据分析、数据评估、数据清洗、数据监控、错误预警等内容,解决数据质量问题,使数据的质量得以改善,使其满足数据需求方对数据质量的规则要……查看详情

    发布时间:2019.11.05来源:知乎浏览量:1133次

  • 高质量的数据一般包括哪些特征?

    高质量的数据一般包括哪些特征?

    ​基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是企业所收集的数据可能不完全,或者更新不……查看详情

    发布时间:2022.06.09来源:小亿浏览量:3207次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议