数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:207次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 大数据是大问题?组织需要为数据管理负责

    大数据是大问题?组织需要为数据管理负责

    如果数据收集在2018年让人们明白一件事的话,那就是使用数据的公司与商业模式依赖数据利用的公司之间存在一条明显而深刻的界线。由于剑桥分析……查看详情

    发布时间:2019.04.09来源:亿信华辰浏览量:126次

  • 从元数据角度来认识大数据

    从元数据角度来认识大数据

    什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数……查看详情

    发布时间:2020.02.21来源:知乎浏览量:175次

  • 企业数据治理的重点和难点在那里?

    企业数据治理的重点和难点在那里?

    企业数据治理的重点和难点主要体现在以下4点:.需要企业高层支持,将数据治理工作放在企业重点工作中,保证对数据治理项目人力物力的投入,提高……查看详情

    发布时间:2019.09.18来源:知乎浏览量:297次

  • 数据清洗与数据治理的3个不同点

    数据清洗与数据治理的3个不同点

    ​数据清洗,是指发现并纠正数据文件中可识别的错误的最后一道程序,是数据治理工作中必不可少的一项关键任务,是数据治理的子集.……查看详情

    发布时间:2021.04.09来源:亿信数据治理研究院浏览量:1225次

  • 区块链是金融数据治理的天然工具

    区块链是金融数据治理的天然工具

    一、从金融数据管理到金融数据治理进入“大数据时代”,不仅催生更多金融业态,数据体量更是呈现爆炸式增长。如何将金融……查看详情

    发布时间:2019.01.07来源:亿信华辰浏览量:159次

  • 数据治理之道帮助企业完成数字化转型

    数据治理之道帮助企业完成数字化转型

    数据治理不能再只是面向数据部门了,需要成为面向全企业用户的工作环境,需要以全企业用户为中心,从给用户提供服务的角度,管理好数据的同时为用……查看详情

    发布时间:2020.06.28来源:知乎浏览量:141次

  • 中小银行数据治理工作所面临的问题

    中小银行数据治理工作所面临的问题

    虽然各银行积极响应监管要求,开展数据治理工作,但《中小银行金融科技发展研究报告(2019)》显示中小银行的数据治理基本处于萌芽期,达91……查看详情

    发布时间:2020.07.09来源:小亿浏览量:258次

  • 大数据资产管理总体框架概述

    大数据资产管理总体框架概述

    随着大数据时代的来临,对数据的重视提到了前所未有的高度,“数据即资产”已经被广泛认可。数据就像企业的根基,是各企业尚待发掘的财富,即将被……查看详情

    发布时间:2020.08.28来源:知乎浏览量:146次

  • 数据治理 VS 数据管理!

    数据治理 VS 数据管理!

    与早期的数字化原生企业相比,不进行数据管理或治理的企业将面临着严重的后果 。至于说到良好的数据管理和应用的实践,大多数人只会将这个词与那……查看详情

    发布时间:2022.06.15来源:互联网浏览量:257次

  • 试论加强数据治理能力的重要性

    试论加强数据治理能力的重要性

    网络信息资源,是指所有以电子数据形式存储在信息光、磁等非纸质的文字、图像、声音、动画等多种形式的载体中,并通过网络通信、计算机或终端等方……查看详情

    发布时间:2018.12.05来源:网络传播杂志浏览量:158次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议