数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:220次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业如何有效进行数据治理

    企业如何有效进行数据治理

    如果你处理或使用过大量数据,一定有听到过“数据治理”这个词。你会思考数据治理是什么?……查看详情

    发布时间:2019.01.18来源:亿信华辰浏览量:168次

  • 中国地方政府数据治理机构的初步研究:现状与模式

    中国地方政府数据治理机构的初步研究:现状与模式

    立数据治理机构是中国地方政府迎接数字时代的一项重要治理创新。本文对近年来先后成立的地方政府数据治理机构的发展现状进行了详细梳理,对其隶属……查看详情

    发布时间:2019.02.25来源:电子政务网浏览量:169次

  • 大数据资产管理总体框架概述

    大数据资产管理总体框架概述

    随着大数据时代的来临,对数据的重视提到了前所未有的高度,“数据即资产”已经被广泛认可。数据就像企业的根基,是各企业尚待发掘的财富,即将被……查看详情

    发布时间:2019.02.21来源:知乎浏览量:560次

  • 什么是cgeit?对经验丰富的IT治理专业人员的认证

    什么是cgeit?对经验丰富的IT治理专业人员的认证

    cgeit是一个供应商中立的认证,为负责管理it企业治理的IT专业人士设计,以验证他们在该领域的技能。……查看详情

    发布时间:2019.01.09来源:亿信华辰浏览量:146次

  • 数据治理:让数据质量更好(data governance)

    数据治理:让数据质量更好(data governance)

    核心提示:大数据时代数据产生的价值越来越大,基于数据的相关技术、应用形式也在快速发展,开发基于数据的新型应用已经成为高校信息化建设的一个……查看详情

    发布时间:2019.11.22来源:CSDN浏览量:688次

  • 数据质量及数据质量管理一个较全面的介绍

    数据质量及数据质量管理一个较全面的介绍

    很多企业数据项目的失败归根结底都是数据质量不高造成的。数据质量不高已经成为困扰此类项目的开发人员与用户的一个严重问题。为了提高大家对数据……查看详情

    发布时间:2020.01.09来源:CSDN浏览量:163次

  • 主数据管理从哪着手?如何进行?

    主数据管理从哪着手?如何进行?

    所有主数据必须使用同一编码规则,如果编码不同,系统永远无法打通对接。如果有国标,尽量采用国标,未来也便于对接供应链体系中上下游的供应商和……查看详情

    发布时间:2021.05.07来源:亿信数据治理知识库浏览量:274次

  • 大数据构成挑战?数据治理提供解决方案

    大数据构成挑战?数据治理提供解决方案

    大数据导致许多组织的复杂性,不仅仅是因为他们收集的数据量很大,而是因为他们收集的数据种类繁多。……查看详情

    发布时间:2019.01.23来源:亿信华辰浏览量:134次

  • 数据治理带给企业的6个惊喜

    数据治理带给企业的6个惊喜

    数据治理实际是一把双刃剑。一方面,法律法规的强制规定能立即引起客户对数据治理的重视。另一方面,为了达到合规,很多企业在实际操作中只会做到……查看详情

    发布时间:2019.11.22来源:知乎浏览量:149次

  • 数据质量监控

    数据质量监控

    数据质量监控可以分为数据质量的事前预防控制、事中过程控制和事后监督控制:……查看详情

    发布时间:2019.12.06来源:知乎浏览量:237次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议