数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:274次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2021公安数据治理的目标

    2021公安数据治理的目标

    公安数据治理的目标是实现全局数据资源的有效整合,有效解决公安力量分散、资源分割、信息孤岛、运行封闭等问题,最终打破部门壁垒和警种壁垒。……查看详情

    发布时间:2021.04.29来源:亿信数据治理知识库浏览量:415次

  • 数据治理在大数据领域的重要性

    数据治理在大数据领域的重要性

    即使在过去,企业也要面对超出其基础设施和流程处理能力的大量数据,更不用说要从数据中挖掘出对制定有效决策有实际价值的情报了。如今,随着种类……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:191次

  • 中小行纷纷设立数据治理专营部门

    中小行纷纷设立数据治理专营部门

    “数据治理基础建设缺失、人才匮乏、意识觉醒较晚。”一名来参加今日第三届中国数字银行论坛的西部中小银行人士,用了三个并列短句,来形容目前中……查看详情

    发布时间:2019.11.29来源:CSDN浏览量:178次

  • 为您的数据治理策略选择一个更聪明的比喻

    为您的数据治理策略选择一个更聪明的比喻

    组织希望“数据驱动”,其要点是他们希望人们使用数据来做出决策。领导们知道太多的人组成的东西。每一……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:213次

  • 企业数字化转型需重视哪些问题

    企业数字化转型需重视哪些问题

    大数据可以帮助企业制定可行的战略规划,获取客户洞察力,支持客户购买行为,建立新的商业模式,从而赢得竞争优势。成功的企业数字案例显然有自己……查看详情

    发布时间:2019.11.07来源:知乎浏览量:178次

  • 大数据治理的语义方法

    大数据治理的语义方法

    正如Coyne所说:“数据治理正在成长为一套实践,软件和系统是其中不可或缺的一部分。但他们只是其中的一部分。您在更高层次上拥有的是实践和……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:226次

  • 企业数据治理中的应对

    企业数据治理中的应对

    首先,数据治理的核心认识是,数据治理是一个持续并且长久的一个过程,不同的产品可以解决比如采集、传输等数据治理层面上的不同问题,但并不存在……查看详情

    发布时间:2019.11.01来源:知乎浏览量:237次

  • 杰出数据科学家的关键技能是什么?

    杰出数据科学家的关键技能是什么?

    学习如何应用不同的Python或R算法真的很简单:众所周知, 我们只需要修改一两行代码,就能将线性回归迁移到神经网络、SVM,或者你喜欢……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:180次

  • 数据质量是什么?控制数据质量的三个方法都在这

    数据质量是什么?控制数据质量的三个方法都在这

    目前有三种基本方法可以实现真正的数据质量。它们有助于提供可用于收集有用的商业情报和做出正确决策的准确数据。这些开发和维护数据质量的方法都……查看详情

    发布时间:2021.08.19来源:亿信华辰数据治理知识库浏览量:241次

  • 大数据时代的数据治理

    大数据时代的数据治理

    随着Hadoop技术的提升,数据如何进来,如何整合,开展什么样的应用都已经有了成熟的案例,可是,同传统数仓时代一样,垃圾进垃圾出,如何破……查看详情

    发布时间:2020.03.19来源:知乎浏览量:192次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议