数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:222次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业数据治理的实际步骤

    企业数据治理的实际步骤

    数据治理是一项业务活动。到目前为止,已经有多项努力从IT内部开始。但是,数据属于业务,而不属于IT。IT可以提供建议,帮助管理存储库,提……查看详情

    发布时间:2018.11.20来源:数据治理浏览量:144次

  • 数据治理准备的五大支柱:团队资源

    数据治理准备的五大支柱:团队资源

    Facebook丑闻突显了组织需要理解和应用数据治理准备的五大支柱。……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:181次

  • 来自园艺的5个数据治理课程

    来自园艺的5个数据治理课程

    所有这些数据增长和收购挑战都要求我们重新考虑我们的数据治理策略。我们根本没有确保正确管理和使用数据所需的可见性。我们的首要任务是消除风险……查看详情

    发布时间:2018.12.04来源:Debi Tadd浏览量:264次

  • 数据治理的坑你遇到过几个?

    数据治理的坑你遇到过几个?

    数据治理是一项长期而繁杂的工作,很多时候大家都为如何做好数据治理而感到困惑,甚至很多时候对此失去了信心。……查看详情

    发布时间:2019.08.19来源:御数坊浏览量:191次

  • 简述数据资产管理方案必须注意的6点

    简述数据资产管理方案必须注意的6点

    “数据资产管理”一词,在国内首次由DAMS(中国数据资产管理峰会)组委会正式提出。首届“中国数据资产……查看详情

    发布时间:2020.08.14来源:知乎浏览量:168次

  • 大型企业数据治理的现状和解决方案

    大型企业数据治理的现状和解决方案

    在大数据时代,数据治理是所有的拥有大量数据的公司的巨大的挑战。没有数据,企业缺乏用于做决策的数据的支持。可是有了越来越多的数据,很多情况……查看详情

    发布时间:2020.03.24来源:知乎浏览量:165次

  • 数据治理:推动结果的引擎

    数据治理:推动结果的引擎

    组织成功取决于某些与共同业务目标一致的构建块。这些构建块包括业务活动,数据和分析。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:185次

  • 企业如何做好数据安全管理?

    企业如何做好数据安全管理?

    数据安全对企业生存发展举足轻重,数据资产的外泄、破坏都会导致无可挽回的经济损失和核心竞争力缺失。而绝大多数中小企业注重业务的快速发展,往……查看详情

    发布时间:2022.05.27来源:小亿浏览量:301次

  • 数字信任:通过数据治理获取并保持数字化

    数字信任:通过数据治理获取并保持数字化

    数字信任可以成就或打破品牌。……查看详情

    发布时间:2019.01.27来源:亿信华辰浏览量:187次

  • 数据治理这个事儿啊,不是个事儿

    数据治理这个事儿啊,不是个事儿

    数据治理是一个包含可用性,适用性,完整性和安全性的四向框架。它是由使用技术的利益相关者使用的一组流程,用于确保管理和保护重要的关键数据。……查看详情

    发布时间:2019.06.28来源:知乎浏览量:126次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议