数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:201次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 业务系统的数据资产管理为什么这么难?

    业务系统的数据资产管理为什么这么难?

    如果你做过BI或大数据,一定会接触数据资产管理的一些概念,比如元数据,数据字典,血统分析等等,但你会发现,要做好大数据平台的数据资产管理……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:166次

  • 国内主流的主数据管理方案

    国内主流的主数据管理方案

    主数据管理 (MDM) 是一种能够定义和管理组织中关键数据的全面方法。它提供跨整个企业的一站式可信任数据视图、敏捷的自助服务访问、基于分……查看详情

    发布时间:2020.05.07来源:知乎浏览量:578次

  • 医疗数据治理在大数据分析中的作用

    医疗数据治理在大数据分析中的作用

    数据治理对医疗保健组织意味着什么?为什么在进行大数据分析之前掌握它至关重要?数据一直是医疗保健行业的生命线。从血压读数和手术记录到保险索……查看详情

    发布时间:2018.11.19来源:Thinkstock浏览量:153次

  • 融”出生命力 “合”出新动能:贵阳推动大数据与实体经济深度融合发展

    融”出生命力 “合”出新动能:贵阳推动大数据与实体经济深度融合发展

    “它以当前中国经济罕见的两位数增长率,领跑全国城市。它以创新驱动传统产业转型升级的路径,成为后发优势地区仰望的标杆。”这是去年12月15……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:145次

  • 金融业如何解困破局、实现数据有序治理和高效利用

    金融业如何解困破局、实现数据有序治理和高效利用

    现如今金融业如何解困破局、实现数据有序治理和高效利用,是需要共同探讨的重点议题。数据治理应遵循四大基本原则。……查看详情

    发布时间:2019.12.12来源:知乎浏览量:132次

  • 数据治理:让数据质量更好

    数据治理:让数据质量更好

    大数据时代数据产生的价值越来越大,基于数据的相关技术、应用形式也在快速发展,开发基于数据的新型应用已经成为高校信息化建设的一个重点领域。……查看详情

    发布时间:2019.02.12来源:亿信华辰浏览量:251次

  • 数据治理到底能治什么,怎么治

    数据治理到底能治什么,怎么治

    近年来,数据治理成为挖掘数据价值的重要手段和工具。随着大数据平台和工业互联网兴起,数据治理平台主要采用数据中台技术和微服务架构初步替代传……查看详情

    发布时间:2020.03.26来源:知乎浏览量:137次

  • 健康的共同依赖:数据管理和数据治理

    健康的共同依赖:数据管理和数据治理

    现在,数据管理和数据治理比以往任何时候都更加重要。数据驱动业务的超竞争特性意味着组织需要比以往更多地从数据中获得更多 - 而且速度更快。……查看详情

    发布时间:2019.02.15来源:亿信华辰浏览量:142次

  • 数据清洗与数据治理的3个不同点

    数据清洗与数据治理的3个不同点

    ​数据清洗,是指发现并纠正数据文件中可识别的错误的最后一道程序,是数据治理工作中必不可少的一项关键任务,是数据治理的子集.……查看详情

    发布时间:2021.04.09来源:亿信数据治理研究院浏览量:1213次

  • 数据指标体系和数据治理的管理

    数据指标体系和数据治理的管理

    我们提到过为什么要搭建指标体系,相信大家在看数据相关招聘岗位简介的时候,也经常看到有关搭建指标体系的要求,因此这里简单的给出两点做指标体……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:170次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议