数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:196次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据管理与数据治理的区别

    数据管理与数据治理的区别

    当我们谈数据资产管理时,我们究竟在谈什么?就目前而言,我们谈论得最多的非数据管理和数据治理这两个概念莫属。但是对于这两个概念,两者的准确……查看详情

    发布时间:2018.09.13来源:浏览量:118次

  • 如何获得各部门系统的数据?

    如何获得各部门系统的数据?

    不少学校在开展数据治理的时候,会遇到部门数据共享的问题。一方面,一些部门不愿意分享所管理的数据,比如,认为拥有某些数据是特权,或担心数据……查看详情

    发布时间:2020.10.31来源:知乎浏览量:219次

  • 在抗灾中积累治理“大数据”

    在抗灾中积累治理“大数据”

    每一次应对灾害,无论是经验还是教训,都会构成全国其他地方“诊治”灾害的“大数据”参考……查看详情

    发布时间:2018.09.25来源:人民日报浏览量:113次

  • 数据治理的六大优势

    数据治理的六大优势

    重要的是,我们认识到数据治理(DG)的优势超出了通用数据保护法规(GDPR)的要求。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:224次

  • 员工数据治理政策:最小化影响,实现价值最大化

    员工数据治理政策:最小化影响,实现价值最大化

    随着越来越多的法规要求和投资者压力促使投资管理公司实施新的安全,治理和合规政策及技术解决方案,公司正在经历由这些实施带来的新业务挑战。……查看详情

    发布时间:2018.12.20来源:亿信华辰浏览量:137次

  • 如何搭建数据质量管理平台

    如何搭建数据质量管理平台

    数据往往在一个企业是相当于一个重要资产,企业在经营的过程中也会积累不少各类数据,这类数据后期也可通过归纳、提炼从而进行深度挖掘分析,给企……查看详情

    发布时间:2019.07.30来源:知乎浏览量:137次

  • 数据治理模型 - 组织数据质量管理的责任

    数据治理模型 - 组织数据质量管理的责任

    企业需要数据质量管理(DQM),它结合了业务驱动和技术观点,以应对需要高质量企业数据的战略和运营挑战。迄今为止,公司已将DQM的责任主要……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:190次

  • 大数据是大问题?组织需要为数据管理负责

    大数据是大问题?组织需要为数据管理负责

    如果数据收集在2018年让人们明白一件事的话,那就是使用数据的公司与商业模式依赖数据利用的公司之间存在一条明显而深刻的界线。……查看详情

    发布时间:2019.04.08来源:亿信华辰浏览量:141次

  • 中国地方政府数据治理机构的初步研究:现状与模式

    中国地方政府数据治理机构的初步研究:现状与模式

    立数据治理机构是中国地方政府迎接数字时代的一项重要治理创新。本文对近年来先后成立的地方政府数据治理机构的发展现状进行了详细梳理,对其隶属……查看详情

    发布时间:2019.02.25来源:电子政务网浏览量:153次

  • 企业数据治理所面临的挑战

    企业数据治理所面临的挑战

    每年随着数据量的增长,大数据平台需要投资扩容,但大量的存量应用依赖的数据也在同步增长,因此也需要扩容,当然这份冗余的数据会越来越大……查看详情

    发布时间:2019.10.31来源:知乎浏览量:150次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议