数据治理的血缘分析

发布时间:2019.11.22来源:CSDN浏览量:204次标签:数据治理

数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。

有时被概念瞎蒙了,不知道到底如何追溯,落不了地。本人接触的数据治理项目还主要是将各个来源的数据进行整理融合,形成人地事物组织几个业务大类数据。至于详细的ODS、DWD、DWA等数据组织请阅读这篇文章:


数据治理概述
本文主要从数据追溯的业务需求来分析一下,一切还是要从需求出发,这里的数据处理都是Oracle关系数据库之间的融合,血缘分析就划分为表结构血缘分析和记录级的血缘分析;这两类业务场景:

表结构血缘分析
表结构血缘分析
针对表结构的情况,最终用户和运维用户最需要关注,目标表的每个字段的数据来源有哪些?也就是建立一个源表、源字段和目标表、目标字段的映射关系,一个目标表可以对应多个来源表的字段,比如:姓名字段,可能来至于户籍人口表也可能来至于流动人口表或老年人表,也就是意味着这三张表合并起来的人口,才是这个区域的所有人口.
通过上图我们就可以清楚的看到从目标表的目标字段出发,知道数据库中数据处理的规则,清楚的了解每个字段数据的来源。
至于其中ODS、DWD、DWA的关系,参照上面所述先去了解。

记录级血缘分析
记录级血缘分析
记录级的血缘分析,就是从当前记录出发可以按时间查看该记录所有的变更过程。一条记录的生成可能原始对应两个表的两条记录,这种是要追溯跟踪的。
如果再精细跟踪,就可以做到字段级的血缘分析,与表结构的血缘分析就可以完美呼应。
单击某一个字段,可查看该字段的血缘关系;一个是以此字段为目标的血缘追溯,一个是以此字段为源的血缘追溯
这里就要看具体应用需求来定,毕竟做的越精细实现方案会越复杂。
血缘分析毕竟解决的问题是数据出了错之后能明确知道是哪一步环节的哪个原始数据出问题了,所以一般到记录级就基本可以进行追溯跟踪了。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理的发展历程

    数据治理的发展历程

    数据治理技术的发展使得其中最好的技术为组织的数据景观提供了完全的透明性,并为业务用户在搜索、访问和应用数据时提供了一种方便快捷的体验。……查看详情

    发布时间:2018.11.19来源:艾米丽华盛顿浏览量:195次

  • 为什么数据标准这么重要,三个小招教你实现

    为什么数据标准这么重要,三个小招教你实现

    评价是现代社会各领域的一项经常性的工作,是科学做出管理决策的重要依据。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单……查看详情

    发布时间:2020.07.17来源:CSDN浏览量:112次

  • 政务大数据治理的本质是什么,包含哪些建设内容?

    政务大数据治理的本质是什么,包含哪些建设内容?

    为了让全国各地的人民群众,都可以无障碍地享受到祖国繁荣发展与社会全面进步带来的生活水平提升,我国已经在多个地区的一些职能机构中渗透和运行……查看详情

    发布时间:2021.05.21来源:亿信数据治理知识库浏览量:289次

  • 数据治理准备的五大支柱:倡议赞助

    数据治理准备的五大支柱:倡议赞助

    “Facebook是全球数据治理的核心。”3月19日“华尔街日报”的一篇文章总结了我们所处的位置。在通用数据保护法规(GDPR)生效仅两……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:156次

  • 大数据管理实践在风险中受到关注

    大数据管理实践在风险中受到关注

    越来越多的情况是,数据专业也必须将这种态度带到更大的世界。……查看详情

    发布时间:2019.03.21来源:亿信华辰浏览量:145次

  • 治理,管理和质量角色和责任

    治理,管理和质量角色和责任

    最好的数据治理计划通过减少模糊性,建立明确的问责制以及向所有数据利益相关者传播与数据相关的信息,积极主动地在数据相关问题开始之前采取措施……查看详情

    发布时间:2019.03.18来源:亿信华辰浏览量:165次

  • 以数据中台为切入点,场景/应用驱动源头数据治理

    以数据中台为切入点,场景/应用驱动源头数据治理

    数据中台通常是应用驱动构建,所处理的数据是业务关心和使用的数据。在数据中台开发与运营服务的过程中,面临很多源头数据的问题,比如不同系统的……查看详情

    发布时间:2020.04.01来源:知乎浏览量:167次

  • 数据质量包括那些方面

    数据质量包括那些方面

    数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情

    发布时间:2020.04.09来源:百度浏览量:237次

  • 大数据治理平台建设过程

    大数据治理平台建设过程

    分为三个层次,分别为战略与治理保障、大数据管理和大数据应用与服务,其中战略与治理保障包括,数据战略规划与评估,数据治理组织与职责、数据制……查看详情

    发布时间:2019.08.19来源:CSDN浏览量:330次

  • 数据太多、太乱、太杂?你需要这样一套数据治理平台

    数据太多、太乱、太杂?你需要这样一套数据治理平台

    当前,企业变革已经成为企业适应剧烈变化的市场环境、实现长期发展的必经之路。然而,过去为组织带来工作效率提升的烟囱式的孤岛式的业务系统……查看详情

    发布时间:2019.11.20来源:知乎浏览量:160次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议