从元数据角度来认识大数据

发布时间:2020.02.21来源:知乎浏览量:175次标签:数据治理

什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数据流中的血缘关系”、“如何找到我需要的数据”、“如何使用数据”和“数据的生产进度”问题。



元数据管理是做什么?

元数据在数据平台对原信息的收集、汇总和传递将数据平台各个模块整合起来。元数据管理系统是收集线上db、solor集群、hbase集群和hive集群的元数据信息,并将其传递给各其他系统。

元数据管理为大数据平台绘制数据地图、统一数据口径、标明数据方位、分析数据关系、管理模型变更及精确到字段级别的影响分析。打通上下游数据继承关系断层,为数据质量维护和业务逻辑可视化打下坚实基础。

要实现元数据管理有三个方面:

1、采集:指从各种工具中,把各种类型的元数据采集进来,采集是元数据管理第一步。

2、存储:采集之后需要相应的存储策略来对元数据进行存储,这需要在不改变存储架构的情况下扩展元数据存储的类型;

3、分析:在采集和存储完成后,对已经存储的元数据进行管理分析。

在这里我们主要对元数据管理应用的元数据分析、数据地图功能进行深入了解。

元数据分析

假设有一天,我们需要对某一些业务信息指标做一个报表统计,用于前端的数据展示,这些业务信息可能来自于不同的表,通过不同的ETL过程到目标数据仓库,最后展示在一个报表中,如下图所示:

a、血缘分析

假设你在管理报表,有一天你发现有报表数据异常,你需要找出错误的数据并提交流程修正,那么这个错误数据从何而来?一个个核对数据显然不够高效,那你就得知道这个报表的的指标来源,元数据管理工具的血缘分析功能会自动帮助你分析这个错误数据的上游路径,比如这些数据是由table1和table2经过ETL过程进入DW,那么此时你只需要去查找table1和table2以及相关的ETL过程即可。

血缘分析可以清晰的帮助我们了解到所维护的数据的使用与被使用情况,犹如资产一般,便于维护定位与统一管理。

b、影响分析

数据终于更正了,此时你需要及时提醒大家这个数据的更正信息,只需要通知这个数据影响到的实体就可以了,然而整个报表流程的数据传递这么复杂,怎么判断哪些实体会受到这个数据的影响呢。

元数据管理工具的影响分析功能会分析出这个数据的影响范并能用可视化的方式展现出来,只需要更新受所影响的实体。

c、数据地图展现

随着业务规模的日益扩大,报表日益增多,有一天你想了解这个业务所有报表整体情况,有多少数据源和ETL过程组成,此时元数据管理工具的数据地图可以帮助你获取到想要的信息,数据地图展现功能可以通过可视化的方式,对整个业务的情况了如指掌,帮助你更好地观察整个业务流程的情况。


在当今这个大数据时代下,数据即为资产。数据因需求而成为有价资产,数据多寡即穷富,然而无法挖掘的数据是没有任何的价值,换句话说,如果没有管理好元数据,收集和存储的数据都会失去意义,也就没有业务价值。如何管理好元数据是非常重要的,根据权威数据管理研究机构TDWI对数百家国际企业的调研结果,元数据管理的重要性在全部技术主题中位列第一。通过元数据管理,可以形成系统化数据资产的准确视图,通过对元数据的统一视图,管理由各个业务系统的数据,梳理业务元数据之间的关系,并可以对这些数据进行来源、变迁进行跟踪分析。通过精确把握数据获取数据,从而把数据转为有价资产。


市场上对企业级元数据管理的需求还在不断增长,伴随着需求的增加,企业对数据模型和元数据管理互操作性的标准的关注会明显增加。

对企业技术人员而言,元数据管理平台通过将分散、存储结构差异大的资源信息进行描述、定位、检索、评估、分析,实现了信息的结构化,为机器处理创造了可能,从而大大降低数据治理人工成本。正因如此,元数据已经成为了很多大型数据治理项目的基础。

对企业业务人员而言,元数据管理平台通过对业务指标、业务术语、业务规则、业务含义等业务信息进行管控,协助业务人员了解业务含义、行业术语和规则、业务指标取数据口径和影响范围等。

未来,元数据管理势必将成为数字化转型的核心,也是未来趋势。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2019年IT关注的重点:大数据分析的存储架构

    2019年IT关注的重点:大数据分析的存储架构

    存储行业的技术专家和分析师预测,IT组织将专注于改进其存储架构,以便在2019年更好地利用数据分析、人工智能和物联网。并指出,改进大数据……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:98次

  • 数据质量六大评价标准是什么

    数据质量六大评价标准是什么

    随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖……查看详情

    发布时间:2022.03.28来源:小亿浏览量:6467次

  • 企业构建数据中台是否存在一个量化或判断的标准?

    企业构建数据中台是否存在一个量化或判断的标准?

    对这个问题有几种解读,第一种解读是说企业是否要构建自己的数据中台,这个问题有没有标准?以这个问题来讲的话,我们认为所有的企业它都需要数据……查看详情

    发布时间:2021.01.23来源:知乎浏览量:166次

  • 做好大数据治理才能建设好大数据平台

    做好大数据治理才能建设好大数据平台

    数据量不断的增加,对数据分析和管理带来了挑战,分析数据背后的价值也为企业发展,社会进步带来了机遇。因此各行各业开始建设大数据平台,大数据……查看详情

    发布时间:2019.08.15来源:知乎浏览量:171次

  • 即使是善意的数据治理策略失败的3个原因

    即使是善意的数据治理策略失败的3个原因

    也许你曾经遇到过这种情况。您打算在您的工作地点创建一个新的数据治理计划。你做你的研究,通知所有必要的团队,建立一个水密的时间表和预算,在……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:119次

  • 你知道什么是数据中台吗?

    你知道什么是数据中台吗?

    什么是数据中台数据中台是全新的架构变革。过去三十年,企业数据管理都以传统的IT架构为基础。每当技术部门为业务部门解决问题时,需要从业务需……查看详情

    发布时间:2020.11.21来源:国云数据中台浏览量:156次

  • 元数据到元数据治理,这一篇文章就够了

    元数据到元数据治理,这一篇文章就够了

    “元数据管理是企业数据治理的基础”,在数据治理战略实施的时候,这是我们经常会听到看到的一句话。但是,数据治理的概念在国内还并未普及,如何……查看详情

    发布时间:2020.08.14来源:亿信华辰浏览量:142次

  • 数据治理与数据管理:有什么区别?

    数据治理与数据管理:有什么区别?

    如果今天有任何定义成功企业的东西,那就是公司数据的成功理解,使用和策略。了解您的数据并确定如何实施它会带来一系列问题,包括用户和利益相关……查看详情

    发布时间:2018.11.13来源:克里希基德浏览量:133次

  • 98%的企业备战数据治理,尚未入局的你还在等什么

    98%的企业备战数据治理,尚未入局的你还在等什么

    UBM近日发布了一份2018企业数据治理白皮书。白皮书中分析了数据治理的现状:虽然越来越多的企业(尤其是业务部门及IT部门)逐渐开始关注……查看详情

    发布时间:2018.12.10来源:亿信华辰浏览量:172次

  • 数据治理流程

    数据治理流程

    数据治理流程必须通过TSDS数据治理流程审查TEA收集的所有数据。此过程允许用户监督 TEA如何从LEA收集立法规定的数据以及为stud……查看详情

    发布时间:2018.11.27来源:数据治理浏览量:211次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议