数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:230次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业如何进行数据资产管理

    企业如何进行数据资产管理

    大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发……查看详情

    发布时间:2020.08.28来源:知乎浏览量:138次

  • 数据安全问题引担忧 如何给用户一颗“定心丸”?

    数据安全问题引担忧 如何给用户一颗“定心丸”?

    信息化发展已经由IT(Information Technology)时代进入DT(Data Technology)时代,“数据安全与个人……查看详情

    发布时间:2019.02.12来源:亿信华辰浏览量:157次

  • 什么数据可以成为“数据资产”

    什么数据可以成为“数据资产”

    什么数据可以成为数据资产?可作为“资产”的数据资源,表现为以下两种形式:可帮助现有产品实现收益的增长;数据本身可产生价值。……查看详情

    发布时间:2021.09.01来源:亿信华辰浏览量:413次

  • 数据治理(R)演变

    数据治理(R)演变

    数据治理继续发展 - 并且很快。……查看详情

    发布时间:2019.02.15来源:亿信华辰浏览量:138次

  • 大数据行业必备书目:《数据治理知识图谱》限量首发,0元领

    大数据行业必备书目:《数据治理知识图谱》限量首发,0元领

    为了让数据不再熵增,助力政企数字化转型,我们将此心血集结成册,行业首发《数据治理知识图谱》,DAMA中国区主席汪广盛倾情推荐,限量300……查看详情

    发布时间:2021.07.14来源:亿信华辰浏览量:188次

  • 新白皮书提供数据治理计划实施技巧

    新白皮书提供数据治理计划实施技巧

    实施数据治理计划 - 一系列标准化管理实践,以解决数据的创建,使用和报告问题 - 有助于确保医疗保健组织内的大量数据得到质量,可访问性和……查看详情

    发布时间:2018.11.21来源:数据治理浏览量:177次

  • 数据治理引领企业数字化转型

    数据治理引领企业数字化转型

    随着数字化时代的到来,数据已经成为了企业的重要资产之一。然而,如何确保数据的质量、安全性和合规性,成为了企业面临的难题。作为国内知名的数……查看详情

    发布时间:2023.09.26来源:互联网浏览量:148次

  • 数据治理在有效合规计划中的作用

    数据治理在有效合规计划中的作用

    有效的合规计划由许多活动部分组成。关键数据来自运行操作所需的各种工具,文档,系统和技术。因此,企业在试图获得任何特定时间的风险状况的完整……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:136次

  • 2019年需要关注的三个治理趋势

    2019年需要关注的三个治理趋势

    通过精心应用RPA,优先考虑数据质量,并迎合不断变化的劳动力构成,数据专业人员可以有效地指导他们的组织进入数据驱动的未来。……查看详情

    发布时间:2018.12.20来源:亿信华辰浏览量:145次

  • 云端世界数据治理的12步指南

    云端世界数据治理的12步指南

    数据治理是任何大数据战略的关键组成部分。随着公司越来越多地转向数据来影响他们的决策,数据所有者必须了解跨越应用程序,内部部署设施和云的数……查看详情

    发布时间:2018.11.19来源:Joey Jablonski浏览量:173次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议