什么是元数据?元数据管理的作用是什么?

发布时间:2021.03.31来源:数据治理研究院浏览量:259次标签:数据治理

元数据是少量数据,旨在提供有关其他数据的参考信息。例如,在公元前280年,亚历山大大图书馆在每个单独的滚动的末尾附加一个悬挂的小标签。这些标签提供了标题,主题和作者,使图书馆用户无需展开每个滚动条就可以呈现内容,因此可以将滚动条返回到其正确的位置。尽管当时的图书馆员没有将标签上的信息称为“元数据”,但这是最早记录的元数据示例之一,最终演变成几十年前在图书馆中使用的卡片目录(元数据的另一种版本)。1967年,麻省理工学院的Stuart McIntosh和David Griffel首先提到了计算机系统的元数据,当时他们描述了对数字“元语言。”

元数据简史.png

元数据的主要目标是协助研究人员查找相关信息和发现资源。说明中使用的关键字称为“元标记”。元数据还用于组织电子资源,提供数字标识以及支持数据的保存和归档。


元数据通过找到相关标准并提供位置信息来协助研究人员发现资源。在数字营销方面,元数据可用于组织和显示内容,从而最大程度地提高营销力度。元数据可提高品牌知名度并改善“查找性”。


不同的 元数据标准用于不同的学科(例如数字音频文件,网站或博物馆藏品)。网页,例如,a可能包含描述软件语言,用于创建它的工具以及有关该主题的更多信息的位置的元数据。另一方面,博物馆藏品将包含描述艺术类型,艺术家姓名和创作日期的元数据。


1900年代后期


1979年, 国际新闻电信理事会(IPTC)定义了可以插入图像的元数据标准和属性。在1980年代后期,IPTC开始研究信息交换模型(IIM),这是一种具有元数据属性的文件结构,该元数据属性可以应用于图像,文本和其他媒体形式。它于1990年代初完成,并加快了国内和国际报纸之间的新闻交流。他们的第一个标准IPTC 7901弥合了电传打印机和计算机之间的鸿沟。


元数据属性1994年,Adobe开发了一种实际上将元数据“嵌入”到数字图像文件(IPTC标头)中的技术,从而再次提高了标准和标准。Adobe采用IPTC的IIM元数据定义,但未采用整体IIM结构。包含IPTC标题的照片似乎是普通的TIFF或JPEG图像。


尽管有各种各样的元数据系统和标准,但是也有一些专门的和公认的模型可以对“元数据的类型”进行分类。1994年,弗朗西斯·布雷瑟顿(Francis P. Bretherton)和保罗·辛尼(Paul T. Singley)发表了一篇论文,标题为元数据:用户视图,开发了两种不同形式的元数据:指南元数据和结构/控件元数据。指南元数据可帮助研究人员使用自然语言找到特定的项目,通常是关键字(元标记)。数据库对象(表,列,键和索引)的标签称为结构元数据。


2000-2003年


在2001年, 国家标准化组织 (国家信息标准组织)致力于为信息行业(出版商,图书馆和软件开发商)创建行业标准,因此决定认真对待元数据,并发布了该文档, 元数据变得更简单:图书馆指南。手册指出:


“有几种不同类型的元数据,包括描述性,管理性和结构性。描述性元数据描述了用于发现和标识之类的资源。它可以包含诸如标题,摘要,作者和关键字之类的元素。管理元数据提供了有助于管理资源的信息,例如何时以及如何创建资源,文件类型和其他技术信息,以及可以访问该资源的人。权限管理元数据是处理知识产权的管理元数据的一种形式。结构性元数据指示如何将复合对象组合在一起,例如,如何将页面排序以构成章节。”


在2001年,Adobe推出了所谓的 可扩展元数据平台(XMP)。XMP表示与IPTC相同类型的元数据,但包括可扩展标记语言(XML)和资源描述框架(RDF),可扩展标记语言(XML)使用编码的指令来显示文本,而资源描述框架(RDF)是一种简单的通用数字语言,用于表示信息。


启用XMP的应用程序允许在内容创建期间捕获元数据,然后将其嵌入文件以及内容管理系统中。有用的描述(例如标题,作者,可搜索的关键字和版权信息)以易于理解的格式记录。


2002年,拉尔夫·金博尔(Ralph Kimball)在他的书中, 数据仓库工具包,将元数据定义为“定义和描述DW / BI系统的结构,操作和内容的所有信息。” 然后,Kimball描述了三种类型的元数据:


1.技术(结构/控制)元数据是存储在数据源中的信息。它是物理模式(列,表以及这些对象中的存储数据)。这种元数据通常用于构建数据字典。当。。。的时候数据字典 和 元数据存储库 通过比较,可以对任何缺失或不完整的数据进行缺口分析。


2.业务元数据是指 数据仓库,包括可用数据,数据来源以及其与其他数据的关系。


3.流程元数据与数据仓库的运营结果有关。流程元数据是与系统执行时与度量捕获相关的信息,包括可追溯性,沿袭和审核信息。系统何时运行?多长时间?


2003年,佛罗里达图书馆自动化中心数字图书馆服务助理总监Priscilla Caplan决定采用 元数据的演变到下一个层次。她将元数据模式分为不同的类别,以反映其功能的关键方面,例如:


1.描述性元数据是指发现,识别和选择。描述性元数据还可以包括并置和获取。


2.结构性元数据描述内部组织。在数字环境中,逻辑资源通常由多个物理文件组成。结构性元数据将物理文件彼此关联,并与逻辑对象的结构关联。


3.管理元数据提供设计用于资源管理的信息。这包括何时以及如何创建对象,负责控制对它的访问的人员以及与此相关的控制或处理活动。


4.权限管理元数据是指知识产权。在系统中,必须根据用户的个人资料(通过适当的标识证明)批准权利管理,以确保正确分发材料并向权利持有者支付适当的款项。


5.保留元数据本质上是关于管理的。其中包含用于存档和保留资源的信息。数字保存描述了旨在确保可访问资源的过程。


6.技术性元数据方案通常非常庞大且详细,因为IT经常将其使用或用于计算机对计算机的通信。技术元数据描述有关技术的信息(数据库的所有权,数据库的物理特性,性能调整等)。技术元数据是用于描述再现数字记录所需的软件和硬件的术语,包括视频格式(mpeg)和pdf格式。


元数据和营销


2007年,Google改变了其搜索引擎的工作方式。Google以前是基于适当链接列表的(有些是付费的,有些不是付费的)。但此时,Google扩展了其搜索平台,以包括新闻,图像和视频。结果,将引入新的元数据以使网站和信息可搜索并与SEO相关。


在线和数字营销中发现的元数据是现代营销的重要工具。 元数据可以提供帮助人们找到一个网站。它使Web内容更具可搜索性,并且有效地使用元数据可以增加访问量。营销人员可以在线组织元数据以最大程度地扩大内容的覆盖范围。准确,有条理的元数据是创建易于查找的网站的关键。


此外,元数据是Google搜索过程的一部分,它对搜索引擎优化(SEO)产生了重大影响,并显示在其搜索引擎结果页面(SERP)中。优化元数据,使其富含关键字并着眼于转化,可以增加访问网站的流量。


元数据自动化


Octopai提供自动的机器学习技术 映射和管理元数据使用单个可搜索界面从组织的各种信息系统收集数据。它的三位联合创始人对于每次想要查找特定的元数据时都必须手动跟踪数据旅程而感到沮丧。这将花费几个小时,而且常常不准确。


Amnon Drori,Gal Ziton和Itai Kahalani将他们的挫败感转化为寻找有效的技术解决方案,并创建了一个自动化平台,使BI研究人员可以有效地发现共享的元数据。他们的平台极大地提高了生产率,缩短了上市时间,并减少了由于数据不准确而导致的风险。


元数据管理和GDPR合规性


2018年5月25日, 通用数据保护条例(GDPR)成为法律。新的GDPR法规要求所有允许对消费者进行身份识别的欧盟客户数据都必须匿名或完全删除。从本质上讲,数据可以保留用于大数据研究的目的,但不能用于“跟踪”个人。为了合规,企业必须对自己不存在的数据达到一定程度的认识。


为了更好地理解企业拥有的数据,必须访问关联的元数据。 元数据管理帮助您判断数据来自何处,其在不同系统中的位置以及如何使用。元数据用于管理数据,将帮助符合GDPR。


了解更多元数据管理相关内容:https://www.esenruizhi.com/products/espowermeta.html


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议