企业的元数据和元数据管理平台介绍

发布时间:2020.08.31来源:CSDN浏览量:148次标签:数据治理

元数据管理是做什么?元数据在数据平台对原信息的收集、汇总和传递将数据平台各个模块整合起来。元数据管理系统是收集线上db、solor集群、hbase集群和hive集群的元数据信息,并将其传递给各其他系统。元数据管理为大数据平台绘制数据地图、统一数据口径、标明数据方位、分析数据关系、管理模型变更及精确到字段级别的影响分析。打通上下游数据继承关系断层,为数据质量维护和业务逻辑可视化打下坚实基础。


要实现元数据管理有三个方面:
1、采集:指从各种工具中,把各种类型的元数据采集进来,采集是元数据管理第一步。
2、存储:采集之后需要相应的存储策略来对元数据进行存储,这需要在不改变存储架构的情况下扩展元数据存储的类型;
3、分析:在采集和存储完成后,对已经存储的元数据进行管理分析。

元数据的作用
(1) 元数据是进行数据集成所必需的
数据仓库最大的特点就是它的集成性。这一特点不仅体现在它所包含的数据上,还体现在实施数据仓库项目的过程当中。
一方面,从各个数据源中抽取的数据要按照一定的模式存入数据仓库中,这些数据源与数据仓库中数据的对应关系及转换规则都要存储在元数据知识库中;另一方面,在数据仓库项目实施过程中,直接建立数据仓库往往费时、费力,因此在实践当中,人们可能会按照统一的数据模型,首先建设数据集市,然后在各个数据集市的基础上再建设数据仓库。
不过,当数据集市数量增多时很容易形成“蜘蛛网”现象,而元数据管理是解决“蜘蛛网”的关键。如果在建立数据集市的过程中,注意了元数据管理,在集成到数据仓库中时就会比较顺利;相反,如果在建设数据集市的过程中忽视了元数据管理,那么最后的集成过程就会很困难,甚至不可能实现。

(2) 元数据定义的语义层可以帮助最终用户理解数据仓库中的数据
最终用户不可能象数据仓库系统管理员或开发人员那样熟悉数据库技术,因此迫切需要有一个“翻译”,能够使他们清晰地理解数据仓库中数据的含意。元数据可以实现业务模型与数据模型之间的映射,因而可以把数据以用户需要的方式“翻译”出来,从而帮助最终用户理解和使用数据。

(3) 元数据是保证数据质量的关键
数据仓库或数据集市建立好以后,使用者在使用的时候,常常会产生对数据的怀疑。这些怀疑往往是由于底层的数据对于用户来说是不“透明”的,使用者很自然地对结果产生怀疑。而借助元数据管理系统,最终的使用者对各个数据的来龙去脉以及数据抽取和转换的规则都会很方便地得到,这样他们自然会对数据具有信心;当然也可便捷地发现数据所存在的质量问题。甚至国外有学者还在元数据模型的基础上引入质量维,从更高的角度上来解决这一问题。

(4) 元数据可以支持需求变化
随着信息技术的发展和企业职能的变化,企业的需求也在不断地改变。如何构造一个随着需求改变而平滑变化的软件系统,是软件工程领域中的一个重要问题。传统的信息系统往往是通过文档来适应需求变化,但是仅仅依靠文档还是远远不够的。成功的元数据管理系统可以把整个业务的工作流、数据流和信息流有效地管理起来,使得系统不依赖特定的开发人员,从而提高系统的可扩展性。

简单来说,企业可以尝试以下步骤进行大数据的元数据管理:

考虑到企业可以获取数据的容量和多样性,应该创建一个体现关键大数据业务术语的业务定义词库(本体),该业务定义词库不仅仅包含结构化数据,还可以将半结构化和非结构化数据纳入其中。
及时跟进和理解各种大数据技术中的元数据,提供对其连续、及时地支持,
对业务术语中的敏感大数据进行标记和分类,并执行相应的大数据隐私政策。
将业务元数据和技术元数据进行链接,可以通过操作元数据(如流计算或 ETL 工具所生成的数据)监测大数据的流动;可以通过数据世系分析(血缘分析)在整个信息供应链中实现数据的正向追溯或逆向追溯,了解数据都经历了哪些变化,查看字段在信息供应链各组件间转换是否正确等;可以通过影响分析可以了解具体某个字段的变更会对信息供应链中其他组件中的字段造成哪些影响等。
扩展企业现有的元数据管理角色,以适应大数据治理的需要,提高企业的数据质量,让数据转化为价值。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 云端世界数据治理的12步指南

    云端世界数据治理的12步指南

    数据治理是任何大数据战略的关键组成部分。随着公司越来越多地转向数据来影响他们的决策,数据所有者必须了解跨越应用程序,内部部署设施和云的数……查看详情

    发布时间:2018.11.19来源:Joey Jablonski浏览量:149次

  • 数据治理-理数据,现状分析

    数据治理-理数据,现状分析

    针对企业数据治理所处的内外部环境,从组织、人员、流程、数据四个方面入手,进行数据治理现状的分析。……查看详情

    发布时间:2020.07.17来源:知乎浏览量:157次

  •  赣州银行:数据治理+管控平台,解决数据质量“老大难”

    赣州银行:数据治理+管控平台,解决数据质量“老大难”

    未来在金融科技落地的过程中,在数字化转型的征途上,亿信华辰愿助力银行数据治理每一步都走得踏实,都能见到实效。……查看详情

    发布时间:2021.04.15来源:亿信数据治理研究院浏览量:358次

  • 数据标准化的难题

    数据标准化的难题

    数据标准好制定,但是数据标准落地相对就困难多了。国内的数据标准化工作发展了那么多年,各个行业,各个组织都在建设自己的数据标准,但是你很少……查看详情

    发布时间:2020.11.13来源:知乎浏览量:150次

  • 中小银行行数据治理是否错过最佳建设期?

    中小银行行数据治理是否错过最佳建设期?

    数据治理基础建设缺失、人才匮乏、意识觉醒较晚。目前中小银行数据治理难点有哪些?中小银行行数据治理是否错过最佳建设期。……查看详情

    发布时间:2019.11.28来源:知乎浏览量:112次

  • 走向人工智能治理的趋势

    走向人工智能治理的趋势

    这是人工智能(AI)驱动的自动化和自动机器的时代。自我改进,自我复制,自主智能机器日益普及和迅速扩大的潜力刺激了网络空间,地球空间和空间……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:123次

  • 数据平台,数据中台是什么数据?

    数据平台,数据中台是什么数据?

    数据中台最核心的就是data API,它提供一个一个的可以复用的标准,这种数据服务给到业务系统。构建数据中台和构建数据平台也有很大的区别……查看详情

    发布时间:2021.01.23来源:知乎浏览量:134次

  • 数据治理工具那么多,如何选择适合自己企业的呢?

    数据治理工具那么多,如何选择适合自己企业的呢?

    随着互联网技术的不断发展,人们获取、收集信息的渠道也越来越多样化,各种搜索引擎、通讯工具、社交网站等普及应用,使得数据信息呈迅速增长趋势……查看详情

    发布时间:2019.07.17来源:知乎浏览量:152次

  • 了解当今数据驱动型企业的治理核心

    了解当今数据驱动型企业的治理核心

    数据治理不仅涉及风险管理。它是关于深入了解数据的核心,使组织中的每个人都能更轻松地使用和信任数据,从而获得业务优势。良好的数据治理系统不……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:139次

  • 利用数据治理重新定义数据架构

    利用数据治理重新定义数据架构

    数据和数据管理的重要性,价值和责任正在迅速增加。……查看详情

    发布时间:2019.01.16来源:亿信华辰浏览量:183次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议