元数据管理是什么?元数据管理的意义

发布时间:2021.08.11来源:亿信华辰数据治理知识库浏览量:835次标签:数据治理

元数据通常定义为”关于数据的数据”,元数据贯穿了数据仓库的整个生命周期,使用元数据驱动数据仓库的开发,使数据仓库自动化,可视化。元数据打通了源数据、数据仓库、数据应用,记录数据从产生到消费的全过程。那么元数据管理是什么呢,为什么要进行元数据管理呢?

一、元数据管理是什么

元数据管理是数据治理工作是重中之重,为什么企业内部的数据质量总是不高?其实只要有数据存在就有数据质量问题存在。但是也可以通过一个有效的管理流程来提高企业数据质量,其中最核心的核心就是元数据的管理。

图片1.png 

一般而言,就数据仓库或者大数据平台中的元数据可以按不同的维度分为技术元数据、业务元数据、操作元数据等,元数据管理的范围大致如下四个方面:

· 元数据源:元数据源数据仓库和数据平台中的数据实体定义和结构信息。

· 数据接口:生产系统和操作型系统中采集到数据仓库或者数据平台中的各中数据接口信息。

· 报表展现(BI):报表展现的相关指标和统计口径。

· 数据集成(ETL):数据汇总、处理和分析的数据集成相关信息。

二、元数据管理的意义

对于企业而言,如果企业不通过元数据把各种各样复杂的信息统一管理起来,那么将很难挖掘出现有数据资产的隐藏价值,这时就需要进行元数据管理。元数据管理是指通过计划、实施和控制活动,以实现轻松访问高质量的元数据。那么,元数据管理有什么用呢?

1、资源盘查,纵览全局

以企业全局视角,通过元数据对各业务板块的数据资产进行统一梳理和盘查,能够有助于发掘隐匿数据。通过整理数据资源的基本信息、存储位置信息、数据结构信息,到数据使用情况信息等内容,使数据资源信息能够更加详细、统一、透明,降低“数据查找”的沟通成本,为数据使用挖掘提供支撑。

2、追本溯源,透视本质

企业在做数据分析的时候,有时会出现结果错误,原因可能出在数据本身或数据分析处理的过程。通过对数据来源进行溯源查找,将能够快速有效地定位出现问题的位置,同时,通过数据溯源,能够理清企业数据的脉络,有助于分析某一数据源头波动将会对整体产生怎样的影响。

如果企业能够进行元数据管理,那么就能够让开发和业务人员快速了解数据的上下游关系及其本身的含义;识别并减少冗余数据和流程,减少重复性工作和对冗余、过期、不正确数据的使用;精准定位需要查找使用的数据,减少数据研究的时间成本,提高效率;为企业的数据治理、数据应用、数据服务打好基础。

三、如何进行元数据管理

要实现企业元数据管理有两大基本步骤,一是创建和维护元数据,搞清楚要管理哪些元数据以及这些元数据在什么地方,以何种形态存储,他们之间有有着怎样的联系。二是建立元数据的模型(元模型),要抽象出企业的元模型,建立个元模型之间的逻辑关系。

下面以亿信华辰睿治数据治理工具为例,讲讲如何实现这两大基本步骤:

1. 创建和维护元数据

图片2.png 

亿信华辰睿治数据治理平台内置丰富的采集适配器,通过自动化的采集方式,帮助企业完成数据信息、服务信息与业务信息的采集,自动调取企业内部的元数据。同时,该平台通过多种分析方式帮助企业分析数据流向,具体到字段级的数据解析,如血缘分析、影响分析、关联度分析等,帮助企业获取数据上下游、对象关联对象等等关系,快速定位问题字段,帮助企业降低数据问题的定位难度。

2、建立元模型

图片3.png 

元数据建模是对企业要管理的元数据进行结构化、模型化。元模型的构建要一般要参考公共仓库元模型CWM,但也不能照搬CWM,否则构建的元模型太过臃肿,不够灵活。亿信华辰睿治数据治理平台中的元模型支持CWM规范的同时,提供了一套便捷的自定义管理接口功能,可完全自定义扩展,能够满足元数据管理快速实施的需要,可适应用户在不同时期的不同管理需要。

总的来说,元数据可以说是企业数据资源的应用字典和操作指南,市场上对企业及元数据管理的需求还在不断增长。如果企业自身不具备数据采集、管理的能力,可以考虑与专业的大数据服务商合作。比如利用亿信华辰睿治数据治理平台搭建元数据管理系统,其包含但不限于自动化的采集、高效的元数据链路分析、完备的版本管理和行之有效的元数据质量管理等功能。

 了解更多元数据管理平台工具数据治理工具知识:https://www.esenruizhi.com/products/espowermeta.html


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议