数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:222次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 打开大数据的正确方式——做减法

    打开大数据的正确方式——做减法

    随着数字技术的广泛应用,原本的新奇感已经荡然无存。创新领域内积年累月的争夺不断攫取着人们的时间和注意力,反而令用户感到信息过载、不堪重负……查看详情

    发布时间:2019.04.09来源:亿信华辰浏览量:145次

  • 数据中台与数据仓库相比的四大优势

    数据中台与数据仓库相比的四大优势

    数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。因此,其重点在于数据的集合。数据仓库可使用维度建……查看详情

    发布时间:2020.11.21来源:知乎浏览量:184次

  • 我国数据治理面临的现实挑战

    我国数据治理面临的现实挑战

    数据驱动的经济社会数字化转型,既充分释放了来自数据创造价值的潜力、提高了劳动生产率和治理效率,也带来了前所未有的现实挑战。如何既促发展又……查看详情

    发布时间:2020.10.31来源:知乎浏览量:140次

  • 数据治理,人工智能和医疗保健:令人兴奋的健康新世界

    数据治理,人工智能和医疗保健:令人兴奋的健康新世界

    随着AI变得越来越普遍,对数据治理的需求也在增加。这是一个由政府确定的问题,因为它最近宣布了一个监督大量数据集的道德小组。2017年1月……查看详情

    发布时间:2019.03.06来源:亿信华辰浏览量:225次

  • 什么是数据交换管理平台?

    什么是数据交换管理平台?

    首先来个比较官方的定义,数据交换管理平台是指将分散建设的若干业务系统进行整合,以实现若干个业务子系统之间数据或者文件的传输和共享,提高信……查看详情

    发布时间:2020.04.22来源:知乎浏览量:129次

  • 在信息治理中处于领先地位

    在信息治理中处于领先地位

    随着这一关键战略的出现,应对最新的信息治理,以应对医疗保健领域的众多信息管理挑战。本博客将重点介绍IG为确保将信息视为组织资产而提出的趋……查看详情

    发布时间:2018.11.21来源:信息治理浏览量:162次

  • 从大数据到好数据:缩小数据治理和业务洞察力之间的差距

    从大数据到好数据:缩小数据治理和业务洞察力之间的差距

    尽管在大数据技术上的支出不断增加,但许多组织仍在努力如何从日益增长的数字世界中寻找意义。 ……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:121次

  • 确保数据治理正确 - 为医疗机构提供五个机会

    确保数据治理正确 - 为医疗机构提供五个机会

    医疗保健组织拥有的数据非常有价值 - 它可能是他们拥有的最有价值的资产。在个人层面,患者数据通常包含了解疾病和潜在康复的关键。从更广泛的……查看详情

    发布时间:2019.02.25来源:亿信华辰浏览量:148次

  • 数据质量问题的影响因素

    数据质量问题的影响因素

    数据质量反映的是数据的“适用性(fitness for use)”,即数据满足使用需要的合适程度。数据质量通过完整性、一致性、准确性、及……查看详情

    发布时间:2020.04.09来源:百度浏览量:591次

  • 企业数据治理项目中影响数据质量的5个因素

    企业数据治理项目中影响数据质量的5个因素

    数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情

    发布时间:2020.04.08来源:知乎浏览量:169次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议