数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:217次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理准备的五大支柱:交付能力

    数据治理准备的五大支柱:交付能力

    数据治理准备的五大支柱应成为实施或改进任何总体倡议的起点。……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:242次

  • 数据治理全域解决方案来了:对症下药 各个击破

    数据治理全域解决方案来了:对症下药 各个击破

    如今数据治理作为数字化转型的基础,成为了数字化变革中的焦点和主战场。不少小伙伴向小亿诉苦,“到底该如何着手做数据治理,能不能先做元数据管……查看详情

    发布时间:2022.01.22来源:小亿浏览量:860次

  • 侃侃什么是数据资产管理,数据资产到底是什么

    侃侃什么是数据资产管理,数据资产到底是什么

    近几年来,“数据就是资产”的观念已成为共识,大家对数据价值的重视程度与日俱增,数据资产管理也已被众多企业提上日程……查看详情

    发布时间:2020.08.19来源:微信浏览量:185次

  • 浅谈数据质量管理

    浅谈数据质量管理

    这篇文章主要讲数据治理中的重要内容:数据质量管理。数据治理的理论和实践不断向前发展,但数据质量管理始终是数据治理的初衷,也是最重要的目的……查看详情

    发布时间:2020.06.29来源:CSDN浏览量:191次

  • 国内大数据治理管理平台介绍

    国内大数据治理管理平台介绍

    数据治理的定义是对数据资产管理行使权力和控制的活动集合。其最终目的是挖掘数据价值,推动业务发展,实现盈利。……查看详情

    发布时间:2019.09.12来源:知乎浏览量:375次

  • 启动数据治理框架以取得成功

    启动数据治理框架以取得成功

    许多企业坚持不懈地尝试用数据治理框架来证明自己已经取得了很大的成就。然而,定义那些“伟大的东西”绝非易事 - 因为它们中的大多数只构建了……查看详情

    发布时间:2019.02.13来源:数据治理浏览量:149次

  • 企业怎样保护业务数据的质量

    企业怎样保护业务数据的质量

    企业内容的质量主要从以下三个方面体现:技术人员设计系统时逻辑严谨,符合规范;业务人员通过统一的培训,录入数据时有统一的规范;管理人员发现……查看详情

    发布时间:2019.09.10来源:知乎浏览量:157次

  • 简明扼要的数据治理指南

    简明扼要的数据治理指南

    数据收集是企业执行的最重要的功能之一。通过获取有关您的客户,员工,财务等的数据,您可以确保轻松,可靠地访问有助于指导主要业务决策的信息。……查看详情

    发布时间:2019.07.04来源:知乎浏览量:140次

  • 银行业数据治理还面临着四方面的挑战

    银行业数据治理还面临着四方面的挑战

    一是数据整合度不高。银行内部数据虽多,涉及各个业务条线、各个部门,但未经系统化的治理,数据分布零散化,搜集整合存在错配,未能实现大数据集……查看详情

    发布时间:2019.11.29来源:知乎浏览量:145次

  • 数据治理准备的五大支柱:组织支持

    数据治理准备的五大支柱:组织支持

    企业领导者必须为其数据治理工作提供组织支持。……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:192次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议