数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:222次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据沿袭工具如何促进数据治理策略

    数据沿袭工具如何促进数据治理策略

    企业可以通过跟踪数据更改的方式和时间来加强数据治理工作。专家David Loshin就如何使用数据沿袭产品提供建议。……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:166次

  • 企业架构组织的创新能力如何?

    企业架构组织的创新能力如何?

    回想一下最新的企业架构文章,博客文章,甚至是你读过的职位描述,并算一下至少一次没有提到“创新”的内容?我猜测,“创新”往往被作为有效企业……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:169次

  • 大型企业数据治理的现状和解决方案

    大型企业数据治理的现状和解决方案

    在大数据时代,数据治理是所有的拥有大量数据的公司的巨大的挑战。没有数据,企业缺乏用于做决策的数据的支持。可是有了越来越多的数据,很多情况……查看详情

    发布时间:2020.03.24来源:知乎浏览量:164次

  • 数据标准管理平台解决方案

    数据标准管理平台解决方案

    企业内部开展企业数据资源整合工作,实现对企业核心业务、核心资源的综合管控,是企业信息化的一个核心目标。通过体系化的数据资源管理平台的建设……查看详情

    发布时间:2020.04.28来源:知乎浏览量:208次

  • 如果您没有数据管理策略,您的数据将毫无用处

    如果您没有数据管理策略,您的数据将毫无用处

    在谈到数据革命时,我们会想到大胆的交互式仪表板,其中包含令人大开眼界的见解。这些丰富多彩的图表背后是一个可靠的数据治理系统。数据治理是看……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:142次

  • 数据治理的重点领域:关注数据质量

    数据治理的重点领域:关注数据质量

    由于数据质量,完整性或可用性方面的问题,这种类型的程序通常会出现。……查看详情

    发布时间:2019.03.29来源:亿信华辰浏览量:205次

  • 数据治理的数据架构:主动方法

    数据治理的数据架构:主动方法

    “数据架构是业务战略的物理实现,” 全球数据战略有限公司 EMEA首席顾问Nigel Turner在DATAVERSITY® 企业数据治……查看详情

    发布时间:2019.01.17来源:数据治理浏览量:165次

  • 用于构建数据驱动型企业的敏捷数据治理基础

    用于构建数据驱动型企业的敏捷数据治理基础

    数据驱动型企业是现代企业的基石,良好的数据治理是关键的推动因素。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:156次

  • 什么是数据治理?

    什么是数据治理?

    数据治理是一个包含可用性,适用性,完整性和安全性的四向框架。它是由使用技术的利益相关者使用的一组流程,以确保管理和保护重要和关键数据。它……查看详情

    发布时间:2018.11.16来源:互联网浏览量:174次

  • 使用知识图技术实现数据治理2.0

    使用知识图技术实现数据治理2.0

    当您使用Google,从Netflix挑选电影,与Siri或Alexa交谈,或在Facebook上寻找您的侄子时,您将从知识图谱技术中受……查看详情

    发布时间:2019.02.21来源:亿信华辰浏览量:180次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议