数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:244次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 重新思考数据治理

    重新思考数据治理

    随着数据和分析技术的变化,它们带来了新的数据治理挑战。当然,数据治理有各种定义,具体取决于您询问的对象。出于本文的目的,我们将其定义为确……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:214次

  • 数据标准从发起到落地执行的四个阶段

    数据标准从发起到落地执行的四个阶段

    数据标准的设计从需求发起到落地执行,一般需要经过标准编制、标准审查、标准发布、标准贯彻四个阶段:……查看详情

    发布时间:2020.09.24来源:知乎浏览量:172次

  • 以元数据为基础的数据治理策略

    以元数据为基础的数据治理策略

    数据是公司资产。为了更快地做出决策,用户必须信任它。数据治理打破了整个企业中不同系统的数据孤岛,并建立了一套流程,标准和策略,以使企业范……查看详情

    发布时间:2019.09.04来源:知乎浏览量:279次

  • 3点告诉你如何正确实现数据治理

    3点告诉你如何正确实现数据治理

    数据驱动需要的不只是的新工具的出现。它需要对数据质量进行投资,以改变有关数据捕获系统的设计和使用方式的行为。……查看详情

    发布时间:2021.05.20来源:亿信数据治理知识库浏览量:191次

  • 数据治理:发现阶段

    数据治理:发现阶段

    从数据治理计划的发现阶段开始,将为您提供更大的成功概率。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:170次

  • 大数据环境下的敏感数据治理

    大数据环境下的敏感数据治理

    随着网络技术的快速发展,大量数据在各种业务活动中产生,数据价值越来越凸显,在商业策略、社会治理和国家战略制定过程中,数据都起到了重要的决……查看详情

    发布时间:2019.08.02来源:安全牛浏览量:281次

  • 业务词汇表和元数据:数据治理和词汇表准备

    业务词汇表和元数据:数据治理和词汇表准备

    我经常被问到“我们如何捕获数据词汇表资产”和“我们是否已准备好与数据管理员合作?”我的回答始终是:如果您能说明数据治理计划的目标并拥有赞……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:163次

  • 大数据是大问题?组织需要为数据管理负责

    大数据是大问题?组织需要为数据管理负责

    如果数据收集在2018年让人们明白一件事的话,那就是使用数据的公司与商业模式依赖数据利用的公司之间存在一条明显而深刻的界线。……查看详情

    发布时间:2019.04.08来源:亿信华辰浏览量:171次

  • 治理与管理的区别

    治理与管理的区别

    简而言之,董事会负责监督,规划和管理负责日常运营。每个部分的职责和责任细分更为广泛。无论您采用广泛还是狭隘的方法来处理治理和管理之间的差……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:199次

  • 大数据治理需要解决哪些问题?

    大数据治理需要解决哪些问题?

    随着云时代的来临,大数据也吸引了越来越多的关注。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大……查看详情

    发布时间:2018.10.15来源:数邦客浏览量:181次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议