数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:234次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业如何成功的实现数据治理?

    企业如何成功的实现数据治理?

    当下是一个大数据的时代,如果一个企业没有数据,那么在做决策时就缺乏数据的支持,但是如果企业有了数据,不对数据进行治理,那么就无法充分有效……查看详情

    发布时间:2019.07.18来源:知乎浏览量:178次

  • 数据共享与开发平台

    数据共享与开发平台

    随着经济和社会信息化进程的不断加快,信息资源已经成为重要的战略资源。促进信息资源共享、加强信息资源开发利用,对于提高经济发展效率和社会管……查看详情

    发布时间:2020.08.14来源:知乎浏览量:158次

  • 数据治理过程中核心数据界定怎么破?

    数据治理过程中核心数据界定怎么破?

    数据治理过程中,在我们费了九牛二虎之力盘点出企业当前数据资产的家当,形成了数据资产的清单后,同时也会列明这个业务域的核心数据实体,这就碰……查看详情

    发布时间:2019.08.08来源:CSDN浏览量:170次

  • 2019年的数据架构趋势

    2019年的数据架构趋势

    当今数字业务的一个主要问题是数据的可靠性。许多商业用户仍在评判数据引导分析的最终价值,并持有一定程度的怀疑态度,这只会随着时间的推移而改……查看详情

    发布时间:2019.02.13来源:数据治理浏览量:145次

  • 应用程序组合管理:有效管理您的投资组合

    应用程序组合管理:有效管理您的投资组合

    现在是时候关注您的投资组合阶段的实际管理了。在这里,您需要考虑应用程序的成本效益和风险可接受性。您应该采用主观业务决策,识别问题和/或机……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:139次

  • 金融行业数据治理的问题与对策

    金融行业数据治理的问题与对策

    银行数据治理工作不是个别部门或少数人员能够妥善完成的,而是需要各部门之间、各层级之间的相互支持与协作,尤其需要加强科技部门与业务部门之间……查看详情

    发布时间:2019.10.16来源:知乎浏览量:194次

  • 企业数据治理的目的、意义及挑战有哪些?

    企业数据治理的目的、意义及挑战有哪些?

    随着大数据相关技术的不断成熟,数据作为一种资产,得到了越来越多企业机构的重视,为了能够有效的利用数据资产,数据治理成了当下政府和企业重点……查看详情

    发布时间:2022.05.11来源:小亿浏览量:710次

  • 大数据治理的五个核心要素

    大数据治理的五个核心要素

    当今的大型企业,内部分工日趋细化,采购、服务、市场、销售、开发、支持、物流、财务、人力等各个环节,无不每时每刻产生着大量的数据。数据的格……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:259次

  • 如今企业面临哪些数据湖管理挑战?

    如今企业面临哪些数据湖管理挑战?

    成功的数据治理方案涉及部署策略、标准和流程,以在整个企业中有效正确地利用高质量数据。如果你的企业具有数据湖环境,并希望从中获得高质量的分……查看详情

    发布时间:2020.04.02来源:知乎浏览量:169次

  • 数据治理流程中,最重要的3点都在这

    数据治理流程中,最重要的3点都在这

    数据治理能够带来的好处就在于,更高效地帮助企业将数据价值转化成实际的业务价值。数据“井喷”仍在进行,机器学习、AI等这类十分依赖数据质量……查看详情

    发布时间:2021.05.10来源:亿信数据治理知识库浏览量:545次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议