数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:204次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 如何搭建企业级主数据管理平台

    如何搭建企业级主数据管理平台

    企业应用系统的构建多是以项目为中心,缺乏自上而下的规划。这样势必会导致企业信息孤岛现象越来越严重。主数据作为企业应用系统中最重要的业务单……查看详情

    发布时间:2022.03.17来源:小亿浏览量:256次

  • 如何降低BI系统建设风险?数据治理告诉你答案

    如何降低BI系统建设风险?数据治理告诉你答案

    如何降低BI系统建设风险?如何更好地管理和控制数据,做好数据体系建设,而非打造一个又一个割裂孤立的系统?这其中数据分析与数据治理双翼并行……查看详情

    发布时间:2021.03.23来源:亿信数据治理研究院浏览量:699次

  • 数据治理和数据管理推动成功的词汇表和词典

    数据治理和数据管理推动成功的词汇表和词典

    任何数据管理员的噩梦都是运行会议,创建迂腐和无关的业务词汇表或数据词典,最终收集网络粉尘。但是,跳过构建和维护良好的业务术语表或数据字典……查看详情

    发布时间:2019.02.21来源:亿信华辰浏览量:173次

  • 用于增强数据治理和法规遵从性的容器

    用于增强数据治理和法规遵从性的容器

    在今天分散的存储基础架构中,审计人员如何评估企业数据的使用?总之,很难!……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:159次

  • 数据质量是什么?控制数据质量的三个方法都在这

    数据质量是什么?控制数据质量的三个方法都在这

    目前有三种基本方法可以实现真正的数据质量。它们有助于提供可用于收集有用的商业情报和做出正确决策的准确数据。这些开发和维护数据质量的方法都……查看详情

    发布时间:2021.08.19来源:亿信华辰数据治理知识库浏览量:198次

  • 从数据治理看医疗大数据的发展

    从数据治理看医疗大数据的发展

    《从数据治理看医疗大数据的发展》主要分享医疗大数据中数据治理的重要性,并结合具体案例来讲述大数据治理的框架和应用心得。……查看详情

    发布时间:2019.02.25来源:网络大数据浏览量:162次

  • 四说大数据时代“神话”:从大数据到深数据

    四说大数据时代“神话”:从大数据到深数据

    为国内最大的电商平台之一,苏宁每天要处理数量巨大的数据。为了更快速高效地处理这些数据,苏宁调度平台采取了哪些措施呢?……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:160次

  • 大数据共享交换平台建设方案

    大数据共享交换平台建设方案

    数据交换共享平台,随着各行业信息化的发展,各行业系统及数据越来越多,也对IT系统建设提出了互联互通、共享交换、业务协同、数据治理等多方面……查看详情

    发布时间:2020.08.14来源:知乎浏览量:223次

  • 浅谈数据质量管理

    浅谈数据质量管理

    随着互联网及数字化技术的飞速发展,我们生活在一个数字化转型的时代,各种数字化正在实实在在的改变着企业的日常运营,以及我们每个人的衣食住行……查看详情

    发布时间:2019.07.26来源:知乎浏览量:183次

  • 在AHIMA的医疗保健信息治理框架内

    在AHIMA的医疗保健信息治理框架内

    医疗保健一直在与信息治理斗争。这并不奇怪,考虑到有多少数据以及它来自多少不同的源。美国健康信息管理协会希望改变这种状况。……查看详情

    发布时间:2019.01.15来源:亿信华辰浏览量:178次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议