数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:202次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理和GDPR:世界上最全面的数据监管将如何影响您的业务

    数据治理和GDPR:世界上最全面的数据监管将如何影响您的业务

    如果您是数据专业人员,那么数据治理和GDPR可能就是您现在的首要任务。……查看详情

    发布时间:2019.01.25来源:亿信华辰浏览量:140次

  • 如今的大数据究竟发展到了什么阶段

    如今的大数据究竟发展到了什么阶段

    大数据时代,大数据分析与应用大肆盛行。越来越多的大公司大企业大集团,都越来越重视大数据的影响和作用。……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:142次

  • 数据湖中的数据管理与治理

    数据湖中的数据管理与治理

    当您转换到数据湖时,选择完全集成的数据湖泊管理平台将使您对数据充满信心,并对其进行扩展以包含越来越多的用户和有利于业务的用例。毕竟,这就……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:189次

  • 数据资产管理是做什么的?

    数据资产管理是做什么的?

    随着大数据的持续升温,数据资产管理近年来成为政府和企业领导层特别关注的领域。尽管出现了很多专家和专著,但真正理解这个概念的人并不多,懂得……查看详情

    发布时间:2019.12.19来源:知乎浏览量:146次

  • 数据安全治理所遵循的三大原则

    数据安全治理所遵循的三大原则

    搞清楚数据安全要解决哪些问题、大数据时代下解决这些问题所面临的主要挑战,就可以梳理数据安全治理的核心思路了。简单说,数据安全治理可以遵循……查看详情

    发布时间:2019.05.23来源:知乎浏览量:122次

  • 大数据时代更要重视用户隐私

    大数据时代更要重视用户隐私

    刚买了房,就有装修公司打电话上门;在网店中搜一下笔记本,推送到手机上的阅读页面就出现各种穿插笔记本的广告……日常生活中,你是否也遇到过这……查看详情

    发布时间:2019.03.14来源:亿信华辰浏览量:137次

  • 重大数据治理预测

    重大数据治理预测

    去年见证了数据治理的觉醒 - 或者正如“ 华尔街日报” 所称的那样,“全球数据治理计算”。……查看详情

    发布时间:2019.01.17来源:亿信华辰浏览量:176次

  • 大数据行业必备书目:《数据治理知识图谱》限量首发,0元领

    大数据行业必备书目:《数据治理知识图谱》限量首发,0元领

    为了让数据不再熵增,助力政企数字化转型,我们将此心血集结成册,行业首发《数据治理知识图谱》,DAMA中国区主席汪广盛倾情推荐,限量300……查看详情

    发布时间:2021.07.14来源:亿信华辰浏览量:171次

  • 制定数据治理行动路线和计划

    制定数据治理行动路线和计划

    路线图是使用特定技术方案帮助达到短期或者长期目标的计划,用于新产品、项目或技术领域的开发,是指应用简洁的图形、表格、文字等形式描述技术变……查看详情

    发布时间:2020.07.17来源:知乎浏览量:202次

  • 数据治理2.0:协作数据治理

    数据治理2.0:协作数据治理

    数据治理1.0过于孤立,无法真正有效,因此需要一种新的协作数据治理方法。……查看详情

    发布时间:2019.01.27来源:亿信华辰浏览量:280次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议