数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:202次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 五大数据治​​理用例和驱动因素

    五大数据治​​理用例和驱动因素

    随着数据应用程序的增长,数据治理用例也在增长。而传统的,仅限IT的数据治理方法Data Governance 1.0已经为协作的企业级数……查看详情

    发布时间:2019.01.25来源:亿信华辰浏览量:210次

  • 数字和业务转型始于业务流程

    数字和业务转型始于业务流程

    不断发展的业务环境意味着必须在不断改进的情况下进行数字化和业务转型。……查看详情

    发布时间:2019.02.18来源:亿信华辰浏览量:153次

  • 数据管理和使用:21世纪的治理

    数据管理和使用:21世纪的治理

    预计该管理机构将对新问题和问题进行专家调查,并采用新方法预测今天决策的未来后果。……查看详情

    发布时间:2019.03.20来源:亿信华辰浏览量:143次

  • 中国“大数据转型”引人关注:万亿市场可期 地方密集发力

    中国“大数据转型”引人关注:万亿市场可期 地方密集发力

    以人工智能、大数据、云计算为代表的信息产业,正在成为地方经济发展的新亮点。以大数据产业为例,过去一段时间以来,各地已陆续释放了推动该产业……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:132次

  • 数据治理第5部分:数据治理规范

    数据治理第5部分:数据治理规范

    数据治理第5部分:数据治理规范,本部分为GB/T34960的第5部分。本部分按照GB/T 1.1-2009给出的规则起草。本部分由国家信……查看详情

    发布时间:2019.09.02来源:GB/T34960的第5部分浏览量:413次

  • 数据治理的最佳实践

    数据治理的最佳实践

    数据治理是指确保数据在输入系统时满足精确标准和业务规则的一组流程。数据治理使企业能够控制数据资产的管理。这包括使数据适合其预期目的所需的……查看详情

    发布时间:2018.12.26来源:数据治理浏览量:137次

  • 高质量的数据一般包括哪些特征?

    高质量的数据一般包括哪些特征?

    ​基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是企业所收集的数据可能不完全,或者更新不……查看详情

    发布时间:2022.06.09来源:小亿浏览量:3396次

  • 浅谈数据质量对企业管理的影响

    浅谈数据质量对企业管理的影响

    工欲善其事,必先利其器。亿信数据质量管理平台(EsDataClean)提供从标准定义、质量监控、绩效评估、质量分析、质量报告、重大问题及……查看详情

    发布时间:2020.10.21来源:知乎浏览量:155次

  • 数据标准化的难题

    数据标准化的难题

    数据标准好制定,但是数据标准落地相对就困难多了。国内的数据标准化工作发展了那么多年,各个行业,各个组织都在建设自己的数据标准,但是你很少……查看详情

    发布时间:2019.12.20来源:知乎浏览量:147次

  • 企业构建数据中台是否存在一个量化或判断的标准?

    企业构建数据中台是否存在一个量化或判断的标准?

    对这个问题有几种解读,第一种解读是说企业是否要构建自己的数据中台,这个问题有没有标准?以这个问题来讲的话,我们认为所有的企业它都需要数据……查看详情

    发布时间:2021.02.01来源:知乎浏览量:183次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议