数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:248次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业数字化转型的五化建设

    企业数字化转型的五化建设

    企业数字化转型的五化建设利用新一代信息技术,构建业务数据的采集、传输、存储、处理、分析、可视化结果和反馈的闭环,打不同系统、不同技术、不……查看详情

    发布时间:2020.04.03来源:知乎浏览量:232次

  • 数据治理:你如何叠加?

    数据治理:你如何叠加?

    企业和组织生成的数据比他们知道的更多。……查看详情

    发布时间:2019.04.03来源:亿信华辰浏览量:171次

  • 浅析银行业如何做数据治理

    浅析银行业如何做数据治理

    2018年5月,银保监会发布《银行业金融机构数据治理指引》,从数据治理架构、数据管理、数据质量控制、数据价值实现、监督管理等方面规范银行……查看详情

    发布时间:2019.06.14来源:亿信华辰浏览量:212次

  • 基础数据标准 – 从制定到落实

    基础数据标准 – 从制定到落实

    标准,是旨在一定范围内维护最佳秩序,经协商一致制定并公开颁布认定、共同遵循的一种规范性要求。……查看详情

    发布时间:2019.12.20来源:知乎浏览量:394次

  • 数据治理和数据管理推动成功的词汇表和词典

    数据治理和数据管理推动成功的词汇表和词典

    任何数据管理员的噩梦都是运行会议,创建迂腐和无关的业务词汇表或数据词典,最终收集网络粉尘。但是,跳过构建和维护良好的业务术语表或数据字典……查看详情

    发布时间:2019.02.21来源:亿信华辰浏览量:209次

  • 数据治理技术措施

    数据治理技术措施

    企业构建的信息系统以满足功能应用为主,如果没有整体数据架构,应用系统就没有数据标准可参考,不可避免地会出现不同的应用系统使用不同的数据标……查看详情

    发布时间:2020.10.21来源:知乎浏览量:190次

  • 什么是元数据管理框架?元数据管理框架如何制定?

    什么是元数据管理框架?元数据管理框架如何制定?

    元数据管理框架描述了一种使数据和元数据资产更易于访问和用于实现业务目标的组织方法。它根据组织的需求,动员并扩展了作为元数据管理基础的现有……查看详情

    发布时间:2021.07.16来源:亿信数据治理知识库浏览量:206次

  • 什么是数据交换管理平台?

    什么是数据交换管理平台?

    首先来个比较官方的定义,数据交换管理平台是指将分散建设的若干业务系统进行整合,以实现若干个业务子系统之间数据或者文件的传输和共享,提高信……查看详情

    发布时间:2020.04.22来源:知乎浏览量:157次

  • 企业的数据标准管理包括什么?

    企业的数据标准管理包括什么?

    数据标准(Data Standards)是保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准管理是规范数据标准的制定和实施……查看详情

    发布时间:2020.05.08来源:知乎浏览量:214次

  • 医疗保健数据治理:预测是什么?

    医疗保健数据治理:预测是什么?

    医疗保健数据治理已经远超过应用程序只是满足合规性标准。医疗费用始终是讨论的主题,健康保险状况和“平价医疗法案”(ACA)等政策也是如此。……查看详情

    发布时间:2018.12.03来源:迈克尔帕斯托雷浏览量:221次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议