深入浅出元数据及元数据管理

发布时间:2019.10.24来源:亿信华辰浏览量:88次标签:数据治理

大数据时代下,数据已被公认为一项重要的资产。而元数据管理作为数据管理框架中一项重要的管理职能,也越来越多的出现在大家的视野中。但是对于元数据的概念以及元数据有什么用,非业内人士可能理解的不够清晰。本文将从元数据的概念、元数据管理的作用以及如何做元数据管理这三个方面来介绍一下元数据的基础知识。

元数据管理


什么是元数据

元数据的定义是“关于数据的数据”,但刚接触这个定义,还是不好理解元数据和数据的关系。这里给大家分享一句《DAMA数据管理知识体系指南》中的解释,元数据与数据的关系就像数据与自然界的关系,数据反映了真实世界的交易、事件、对象和关系,而元数据则反映了数据的交易、事件、对象和关系等。简单来说,只要能够用来描述某个数据的,都可以认为是元数据。

举两个例子:

如果将图书馆里面的某一本书当作数据,那么所有用来形容这本书的数据比如书名、书的作者、书的所属类别等都是这本书的元数据。

元数据管理

如果将一部电影看作数据,那么你在该电影海报上看到的所有信息,如电影名、导演、演员、制片人、电影类型等,都可以认为是这部电影的元数据。

元数据管理

对于企业而言,元数据是跟企业所使用的物理数据、业务流程、数据结构等有关的信息,描述了数据(如数据库、数据模型)、概念(如业务流程、应用系统、技术架构)以及它们之间的关系。

元数据管理的作用

理解了元数据的概念后,我们发现元数据有很多、很杂乱,也不知道怎么用,此时我们需要做元数据的管理。元数据管理是指通过计划、实施和控制活动,以实现轻松访问高质量的整合的元数据。

元数据管理到底有什么用?我们还是以前面讲到的图书馆的例子来讲,对图书的元数据管理,其实跟图书馆的目录卡片类似,通过目录卡片可以清楚的查询到图书馆中保存了哪些书、在图书馆的什么位置,目录卡片上面的信息就是图书的元数据,假如没有目录卡片,我们在图书馆里查找书籍将像大海捞针一样困难。

图书馆的目录卡片只是一个很简单的元数据管理,在企业中,元数据管理会更为全面,难度更高,同时也将带来更多的收益:

  • 通过元数据管理,将帮助企业人员清晰的看到企业有哪些数据,分别存放在什么位置,同时帮助理清企业的数据字典,快速查询和定位数据;
  • 通过对数据的上下文关联信息,提升战略信息(如数据仓库、CRM、SCM等)的价值,从而帮助分析人员做出更有效的决策;
  • 通过对数据的上下文背景、历史和起源进行完整的记录并文档化,帮助了解数据的流转流程,从而减少培训成本,降低员工流失的影响;
  • 在变更管理过程中的不同层面上进行更好的影响分析,降低项目失败风险;
  • 识别并减少冗余数据和流程,减少重复工作和对冗余、过期、不正确数据的试用;
  • 为企业的数据治理、数据应用、数据服务打好基础。


如何进行元数据管理

要实现企业元数据管理有两大基本步骤,一是创建和维护元数据,搞清楚要管理哪些元数据以及这些元数据在什么地方,以何种形态存储,他们之间又有着怎样的联系。二是建立元数据的模型(元模型),要抽象出企业的元模型,建立个元模型之间的逻辑关系。

下面以亿信元数据管理平台为例,讲讲如何实现这两大基本步骤:

创建和维护元数据

亿信元数据管理平台内置丰富的采集适配器,通过自动化的采集方式,帮助企业完成数据信息、服务信息与业务信息的采集,自动调取企业内部的元数据。同时,该平台通过多种分析方式帮助企业分析数据流向,具体到字段级的数据解析,如血缘分析、影响分析、关联度分析等,帮助企业获取数据上下游、对象关联对象等等关系,快速定位问题字段,帮助企业降低数据问题的定位难度。

建立元模型

元数据建模是对企业要管理的元数据进行结构化、模型化。元模型的构建要一般要参考公共仓库元模型CWM,但也不能照搬CWM,否则构建的元模型太过臃肿,不够灵活。亿信元数据管理平台中的元模型支持CWM规范的同时,提供了一套便捷的自定义管理接口功能,可完全自定义扩展,能够满足元数据管理快速实施的需要,可适应用户在不同时期的不同管理需要。

小结:元数据管理是企业数据治理的基础。通过元数据管理,可以形成系统化数据资产的准确视图,从而精确把握数据获取数据,把数据转为有价资产。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 大数据应用与治理

    大数据应用与治理

    不可否认的是,大数据产业很快就要迎来自己的爆发期。经过几年基础建设的培育,技术层面已基本可以满足相关应用,所以行业人士也普遍达成共识,接……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:107次

  • 以元数据为基础的数据治理策略

    以元数据为基础的数据治理策略

    数据是公司资产。为了更快地做出决策,用户必须信任它。数据治理打破了整个企业中不同系统的数据孤岛,并建立了一套流程,标准和策略,以使企业范……查看详情

    发布时间:2019.09.04来源:知乎浏览量:111次

  • 数据治理概述

    数据治理概述

    每天,大学的数据都会被评估,创建,使用,存储,存档,报告或删除。数据治理为罗切斯特的这些信息的定义,交换,完整性和安全性设定了标准和协议……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:168次

  • 数据湖治理最佳实践

    数据湖治理最佳实践

    如果没有最佳实践,存储将变得无法维护。自动化数据质量,生命周期和隐私可以持续清理/移动湖中的数据。……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:90次

  • 中国科大:大数据实现本科生学业“全过程”管理

    中国科大:大数据实现本科生学业“全过程”管理

    近年来,中国科学技术大学(以下简称“中国科大”)践行“管理即服务”理念,实现“教、学、管”联动育人,完善“学业追踪”和“困难资助追踪”网……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:60次

  • 数据治理中,如何做好数据清理与归档

    数据治理中,如何做好数据清理与归档

    传统上,数据的清理和归档属于DBA的职责,随着企业数字化转型、数据治理工作的推进,这项工作也被纳入了数据治理工作的重要内容。数据团队定期……查看详情

    发布时间:2021.06.24来源:亿信数据治理知识库浏览量:109次

  • “安全”与“共享”同行,大数据正改变着世界

    “安全”与“共享”同行,大数据正改变着世界

    什么是大数据?早在2011年,世界著名咨询公司麦肯锡就曾在《大数据:下一个创新、竞争和生产力的前沿》报告中对其进行了基础定义:“大数据是……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:97次

  • 为什么集成和治理对数据湖成功至关重要

    为什么集成和治理对数据湖成功至关重要

    这是一个由三部分组成的系列文章的最后一篇文章,探讨如何构建一个能够满足真正企业级数据管理平台所有要求的数据湖。虽然早期的专题文章侧重于H……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:72次

  • 数据共享,奇葩证明的解药——亿信华辰

    数据共享,奇葩证明的解药——亿信华辰

    出境旅游,要求出具“母子关系证明”;市民迁户口,要证明“你爸是你爸”;车在大风中被树木刮伤,理赔要出示“风力证明”;去买房,要证明“结婚……查看详情

    发布时间:2019.03.04来源:亿信华辰浏览量:84次

  • 企业应该将数据治理作为加速数字化转型的催化剂

    企业应该将数据治理作为加速数字化转型的催化剂

    随着许多业务系统和应用程序(包括采购,呼叫中心交互,网站访问,移动应用程序使用以及越来越多的物联网传感器和设备)产生的大量客户数据,应该……查看详情

    发布时间:2019.07.04来源:知乎浏览量:71次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议