美国政府开放数据的元数据标准对我国的启示

发布时间:2019.08.27来源:大连海事大学交通运输管理学院浏览量:235次标签:数据治理

从 2012 年至今,我国已相继上线近 20 个地方政 府开放数据的门户网站,国家层面的统一数据门户 网站 www.data.gov.cn 也在规划建设中。但目前各 地使用了不同的元数据方案,元数据对数据集的描 述不够全面、没有采用机器可读的格式及元数据的取 值不规范等不足限制了目录聚合与元数据采集的自动 实现。因此,在参考和借鉴美国的先进经验时,应重点 关注如下四个方面的启示。

1、 构建以元数据为核心的公共信息资源开放目 录体系 《政务信息系统整合共享实施方案》指出,在 建设 www.data.gov.cn 时,要“基于政务信息资源目录 体系,构建公共信息资源开放目录,按照公共数据开放 有关要求,推动政府部门和公共企事业单位的原始性、 可机器读取、可供社会化再利用的数据集向社会开放, 开展中国数据创新系列活动,鼓励和引导社会化开发 利用” 。 元数据、分类法和编码规则是政务信息资源目录 体系的核心要素,在开放数据背景下应不断完善和发 展,以适应新的需求和挑战,如开放标准、开放许可和 授权、溯源和质量保障、五星模型和关联开放数据等。 我国地方政府开放数据实践中存在的诸如平台建设缺 乏规范、没有统一的元数据标准、数据集分类不一致等 问题,不仅拉开了我国开放数据同世界先进水平的差 距,也为建设国家层面统一的开放平台带来困难。因 此,应在“国际化和本土化相结合、通用化和专门化相 结合”的原则下,建设以元数据为核心的公共信息资 源开放目录体系,开展相关理论研究和实践探索。 

2 、建立各级数据目录间的协调机制 我国应重 视国家层面( 即 www.data.gov.cn) 与各部委、各省市开 放数据目录门户和平台间的协调,建立目录自动聚合 机制。各级政府的数据目录形成一定的层次结构,上 一级的目录应能够聚合下级的目录,以实现数据一次 发布,却能出现在各目录中。同时,也要关注综合性的 数据目录与专业性数据目录( 如地理、统计和交通等) 之间的协调。 美国的经验表明,建立在统一标准之上的“元数 据采集机制”是实现目录自动聚合的基础和关键,值 得研究和借鉴。

3、 全生命周期的规范化管理 美国 M-13-13 确 立了“在信息生命周期的各个阶段都要实施有效管 理”的原则,要求联邦机构重构信息收集和创建过 程,在生命周期的起点就为以后的开放做好准备,包括 确定目标受众,采用机器可读的开放格式、数据标准和 元数据规范等。实践上,元数据方案 POD v1.1 不仅应 用到发布环节,也应用在各机构内部的数据管理中,如 数据清单的描述上,以此来更好地支持下游的信息处 理和传播。 我国在从信息公开到数据开放的转换和升级过程 中,将促进政府信息资源的全生命周期规范化管理。 而从始至终采用一致的元数据标准,将有助于提升数 据共享效率和降低开放成本。

4 、元数据质量的评估和监测 元数据的价值依 赖于它的质量,质量的高低取决于实际的元数据记录 与元数据标准的符合程度。美国开发了“仪表板” ( Project Open Data Dashboard) 评估和监测各联邦机构 对 M-13-13 指令的执行情况,包括 data.json 文件中 的元数据质量。主要的质量指标( quality metrics) 有:是否是有效的 JSON 文档、符合模式定义的元数据 的占比、失效的链接( accessURL 4xx) 的占比、错误的 链接( accessURL 5xx) 的占比及 data.json 文件的最新 修改日期等。 我国在加快开放政府数据工作的同时,应增强质 量意识,重视数据和元数据质量标准、评价方法和保障 体系的建设。 

结 语 
美国的 Data.Gov 上已有超过19.4 万个数据集,这 得益于它的完善的目录聚合功能,而元数据标准起到 了重要作用。本文主要从目录聚合的视角,介绍了具 有普适性的 POD v1.1 标准和 Data.Gov 上的目录聚合 溯源元数据。随着我国各级政府开放数据的深入发 展,特别是国家数据开放网站( www.data.gov.cn) 的建 设,开发元数据标准、元数据采集规范和目录聚合机 制,将是一个十分必要且紧迫的课题。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 什么是数据价值?如何挖掘数据价值实现数字化转型?

    什么是数据价值?如何挖掘数据价值实现数字化转型?

    亿信华辰作为智能数据全生命周期产品与服务提供商,提供数据采集、数据存储、数据治理、数据分析产品全方位服务,帮助您实现数据价值挖掘、数据价……查看详情

    发布时间:2021.07.02来源:亿信华辰浏览量:1620次

  • 数据治理委员会:指导原则

    数据治理委员会:指导原则

    数据所有权 指定义与特定数据集相关的各种责任级别。讨论谁负责特定的数据任务已经使我们机构的数据维护和准确性变得更加简单。……查看详情

    发布时间:2018.11.23来源:数据治理浏览量:179次

  • 什么是元数据?元数据管理的作用是什么?

    什么是元数据?元数据管理的作用是什么?

    为了更好地理解企业拥有的数据,必须访问关联的元数据。 元数据管理帮助您判断数据来自何处,其在不同系统中的位置以及如何使用。元数据用于管理……查看详情

    发布时间:2021.03.31来源:数据治理研究院浏览量:395次

  • 并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    我们生活在一种数据驱动的文化中 - 毫无疑问。从智能手机到拖拉机,我们周围的几乎所有东西都会产生某种形式的数据。为了使事情更具挑战性,数……查看详情

    发布时间:2019.08.02来源:知乎浏览量:182次

  • 数据治理能否提升数据安全性?

    数据治理能否提升数据安全性?

    大数据技术的快速发展不断催生新的产业形态,正成为经济社会发展的新动能。在·发展数字经济、加快培育发展数据要素市场,必须把保障数据安全放在……查看详情

    发布时间:2022.03.07来源:小亿浏览量:230次

  • 企业大数据治理的五个核心要素

    企业大数据治理的五个核心要素

    当今的大型企业,内部分工日趋细化,采购、服务、市场、销售、开发、支持、物流、财务、人力等各个环节,无不每时每刻产生着大量的数据。数据的格……查看详情

    发布时间:2019.08.20来源:知乎浏览量:184次

  • 大数据治理 [Big Data Governance an Emerging Imperative]

    大数据治理 [Big Data Governance an Emerging Imperative]

    《大数据治理》是一个信息治理专家奉献的鸿篇巨制,作者以极其实用和通俗易懂的风格,倾心向读者解读大数据治理这一复杂主题。作为一家大公司的资……查看详情

    发布时间:2018.11.29来源:数据治理浏览量:231次

  • 为什么你应该有一个数据治理策略

    为什么你应该有一个数据治理策略

    垃圾进垃圾出。自打孔卡和电传终端以来,这个座右铭一直是真实的。如今,复杂的IT系统同样依赖于高质量的数据,无论是在会计,生产还是商业智能……查看详情

    发布时间:2018.11.22来源:数据治理浏览量:225次

  • 2019年采用大数据发生重大变化的6个行业

    2019年采用大数据发生重大变化的6个行业

    如今,大数据的应用对几乎任何行业的发展都会产生积极的影响,而采用这项技术,一些行业比其他行业更有可能发生重大的变化。以下是采用大数据发生……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:145次

  • 数据治理:大学数据的分类

    数据治理:大学数据的分类

    所有学院数据都被分类为敏感级别,为理解和管理大学数据提供基础。准确的分类为大学数据应用适当的安全级别提供了基础。这些分类考虑了法律保护(……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:275次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议