深入浅出元数据及元数据管理

发布时间:2019.10.24来源:亿信华辰浏览量:183次标签:数据治理

大数据时代下,数据已被公认为一项重要的资产。而元数据管理作为数据管理框架中一项重要的管理职能,也越来越多的出现在大家的视野中。但是对于元数据的概念以及元数据有什么用,非业内人士可能理解的不够清晰。本文将从元数据的概念、元数据管理的作用以及如何做元数据管理这三个方面来介绍一下元数据的基础知识。

元数据管理


什么是元数据

元数据的定义是“关于数据的数据”,但刚接触这个定义,还是不好理解元数据和数据的关系。这里给大家分享一句《DAMA数据管理知识体系指南》中的解释,元数据与数据的关系就像数据与自然界的关系,数据反映了真实世界的交易、事件、对象和关系,而元数据则反映了数据的交易、事件、对象和关系等。简单来说,只要能够用来描述某个数据的,都可以认为是元数据。

举两个例子:

如果将图书馆里面的某一本书当作数据,那么所有用来形容这本书的数据比如书名、书的作者、书的所属类别等都是这本书的元数据。

元数据管理

如果将一部电影看作数据,那么你在该电影海报上看到的所有信息,如电影名、导演、演员、制片人、电影类型等,都可以认为是这部电影的元数据。

元数据管理

对于企业而言,元数据是跟企业所使用的物理数据、业务流程、数据结构等有关的信息,描述了数据(如数据库、数据模型)、概念(如业务流程、应用系统、技术架构)以及它们之间的关系。

元数据管理的作用

理解了元数据的概念后,我们发现元数据有很多、很杂乱,也不知道怎么用,此时我们需要做元数据的管理。元数据管理是指通过计划、实施和控制活动,以实现轻松访问高质量的整合的元数据。

元数据管理到底有什么用?我们还是以前面讲到的图书馆的例子来讲,对图书的元数据管理,其实跟图书馆的目录卡片类似,通过目录卡片可以清楚的查询到图书馆中保存了哪些书、在图书馆的什么位置,目录卡片上面的信息就是图书的元数据,假如没有目录卡片,我们在图书馆里查找书籍将像大海捞针一样困难。

图书馆的目录卡片只是一个很简单的元数据管理,在企业中,元数据管理会更为全面,难度更高,同时也将带来更多的收益:

  • 通过元数据管理,将帮助企业人员清晰的看到企业有哪些数据,分别存放在什么位置,同时帮助理清企业的数据字典,快速查询和定位数据;
  • 通过对数据的上下文关联信息,提升战略信息(如数据仓库、CRM、SCM等)的价值,从而帮助分析人员做出更有效的决策;
  • 通过对数据的上下文背景、历史和起源进行完整的记录并文档化,帮助了解数据的流转流程,从而减少培训成本,降低员工流失的影响;
  • 在变更管理过程中的不同层面上进行更好的影响分析,降低项目失败风险;
  • 识别并减少冗余数据和流程,减少重复工作和对冗余、过期、不正确数据的试用;
  • 为企业的数据治理、数据应用、数据服务打好基础。


如何进行元数据管理

要实现企业元数据管理有两大基本步骤,一是创建和维护元数据,搞清楚要管理哪些元数据以及这些元数据在什么地方,以何种形态存储,他们之间又有着怎样的联系。二是建立元数据的模型(元模型),要抽象出企业的元模型,建立个元模型之间的逻辑关系。

下面以亿信元数据管理平台为例,讲讲如何实现这两大基本步骤:

创建和维护元数据

亿信元数据管理平台内置丰富的采集适配器,通过自动化的采集方式,帮助企业完成数据信息、服务信息与业务信息的采集,自动调取企业内部的元数据。同时,该平台通过多种分析方式帮助企业分析数据流向,具体到字段级的数据解析,如血缘分析、影响分析、关联度分析等,帮助企业获取数据上下游、对象关联对象等等关系,快速定位问题字段,帮助企业降低数据问题的定位难度。

建立元模型

元数据建模是对企业要管理的元数据进行结构化、模型化。元模型的构建要一般要参考公共仓库元模型CWM,但也不能照搬CWM,否则构建的元模型太过臃肿,不够灵活。亿信元数据管理平台中的元模型支持CWM规范的同时,提供了一套便捷的自定义管理接口功能,可完全自定义扩展,能够满足元数据管理快速实施的需要,可适应用户在不同时期的不同管理需要。

小结:元数据管理是企业数据治理的基础。通过元数据管理,可以形成系统化数据资产的准确视图,从而精确把握数据获取数据,把数据转为有价资产。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理“起航” 推动银行业高质量发展

    数据治理“起航” 推动银行业高质量发展

    银行业金融机构数据治理提上日程。近日,银监会发布《银行业金融机构数据治理指引(征求意见稿)》(以下简称《指引》),要求银行业金融机构将数……查看详情

    发布时间:2019.02.21来源:和讯网浏览量:209次

  • 数据资产管理实践白皮书(2.0版)

    数据资产管理实践白皮书(2.0版)

    本白皮书版权属于中国信息通信研究院云计算与大数 据研究所,并受法律保护。转载、摘编或利用其它方式使用 本白皮书文字或者观点的,应注明……查看详情

    发布时间:2019.09.02来源:中国信息通信研究院云计算与大数据研究所浏览量:582次

  • 常见的主数据管理问题

    常见的主数据管理问题

    主数据管理,包括不仅仅是硬件和软件,还是将数据作为重要资产管理的思想和办法,是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保……查看详情

    发布时间:2020.12.05来源:知乎浏览量:414次

  • 谈谈数据治理是什么?

    谈谈数据治理是什么?

    数据治理这项工作一直都是存在的,和数据库设计的三范式一样都是为了数据的管理。数据治理是一整套完整的组织、制度、技术管理行为。……查看详情

    发布时间:2021.03.06来源:人人都是产品经理浏览量:207次

  • 数据中台与数据仓库相比的四大优势

    数据中台与数据仓库相比的四大优势

    数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。因此,其重点在于数据的集合。数据仓库可使用维度建……查看详情

    发布时间:2020.11.21来源:知乎浏览量:218次

  • 如何实现数据治理合作交流的4点建议

    如何实现数据治理合作交流的4点建议

    数据如同工业的石油一样,成为国家的重要资源,成为推动经济社会增长和发展的重要引擎。大数据、云计算、人工智能是大势所趋,发展这些技术也是人……查看详情

    发布时间:2019.10.25来源:知乎浏览量:187次

  • 医疗保健数据治理:预测是什么?

    医疗保健数据治理:预测是什么?

    医疗保健数据治理已经远超过应用程序只是满足合规性标准。医疗费用始终是讨论的主题,健康保险状况和“平价医疗法案”(ACA)等政策也是如此。……查看详情

    发布时间:2018.12.03来源:迈克尔帕斯托雷浏览量:233次

  • 大数据共享交换平台建设方案

    大数据共享交换平台建设方案

    数据交换共享平台,随着各行业信息化的发展,各行业系统及数据越来越多,也对IT系统建设提出了互联互通、共享交换、业务协同、数据治理等多方面……查看详情

    发布时间:2020.08.14来源:知乎浏览量:263次

  • 构建业务术语表可以增强数据治理

    构建业务术语表可以增强数据治理

    专家表示,数据专业人员负责在整个组织内建立一个通用词汇表,以帮助确保数据治理成功和遵守GDPR。……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:260次

  • 大数据平台下的企业的数据治理

    大数据平台下的企业的数据治理

    数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据……查看详情

    发布时间:2018.11.28来源:数据治理浏览量:191次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议