普及元数据和主数据的联系与定义

发布时间:2020.08.31来源:CSDN浏览量:183次标签:数据治理

数据治理中,我们总是会听到元数据和主数据,我们今天就可以来说说什么是元数据,什么是主数据。

元数据和主数据

1、元数据(metadata)
描述数据的数据,对数据及信息资源的描述性信息
大部分属性字段就是元数据。比如,性别,国籍,出生省份等。这个是最接近自然意义的的数据。

(1)在数据仓库领域中,元数据按用途分成:
业务元数据:提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据
技术元数据:支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。

(2)具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:
描述哪些数据在数据仓库中;
定义要进入数据仓库中的数据和从数据仓库中产生的数据;
记录根据业务事件发生而随之进行的数据抽取工作时间安排;
记录并检测系统数据一致性的要求和执行情况;
衡量数据质量。

(3)基于应用,可以将元数据分成以下的若干种。
数据结构:数据集的名称、关系、字段、约束等;
数据部署:数据集的物理位置;
数据流:数据集之间的流程依赖关系(非参照依赖),包括数据集到另一个数据集的规则;
质量度量:数据集上可以计算的度量;
度量逻辑关系:数据集度量之间的逻辑运算关系;
ETL过程:过程运行的顺序,并行、串行;
数据集快照:一个时间点上,数据在所有数据集上的分布情况;
星型模式元数据:事实表、维度、属性、层次等;
报表语义层:报表指标的规则、过滤条件物理名称和业务名称的对应;
数据访问日志:哪些数据何时被何人访问;
质量稽核日志:何时、何度量被稽核,其结果;
数据装载日志:哪些数据何时被何人装载

(4)元数据的基本管理
元模型管理
通过可视化的用户体验实现:

a.元模型添加、删除、修改、发布等维护功能;
b.了解已有元模型的分类、统计、使用情况、变更追溯
c.每个元模型的生命周期管理等等。

元数据管理
元数据管理实现针对元数据的基本管理功能。
元数据的添加、删除、修改属性等维护功能;
元数据之间关系的建立、删除和跟踪等关系维护功能;
提供元数据发布流程管理,可以更好地管理和跟踪元数据的整个生命周期;

元数据自身质量核查、元数据查询、元数据统计、元数据使用情况分析、元数据变更、元数据版本和生命周期管理等功能。

元数据分析
元数据分析功能主要实现针对元数据的基本分析功能。包括血缘分析(血统分析)、影响分析、实体关联分析、实体影响分析、主机拓扑分析、指标一致性分析等。

2、主数据(Master Data)
主数据(MD Master Data)指系统间的共享数据(例如,客户、供应商、账户和组织部门相关数据)。与记录业务活动,波动较大的交易数据相比,主数据(也称基准数据)变化缓慢。在正规的关系数据模型中,交易记录(例如,订单行项)可通过关键字(例如,订单头或发票编号和产品代码)调出主数据。主数据必须存在并加以正确维护,才能保证交易系统的参照完整性。
从报告或维度建模角度看,主数据指基于其组织或配置指标的维度或层次,而不是实际情况或其自身测量结果。例如,收入、成本和利润是实际情况,而时间、地点、客户和供应商是维度。

主数据和元数据的关系
主数据跟元数据的关系,举个例子的话就想是一本书,主数据就是书里边的正文,实际有用的数据,元数据就是书的目录,是索引,方便你找到主数据的。

好啦!大家明白了什么是主数据和元数据了吗!
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

    计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外…………查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:144次

  • 数据资产管理方案之如何让数据化为价值

    数据资产管理方案之如何让数据化为价值

    数据是资产的概念已经成为行业共识。然而现实中,对数据资产的管理和应用往往还处于摸索阶段,数据资产管理面临诸多挑战。主要分为以下三点:1、……查看详情

    发布时间:2020.08.14来源:知乎浏览量:223次

  • 数据标准在数据治理中的意义

    数据标准在数据治理中的意义

    数据标准是为了规范系统建设时对业务的统一理解,增强业务部门、技术部门对数据的定义与使用的一致性。新系统建设应遵照(自主开发)或尽可能与数……查看详情

    发布时间:2020.04.28来源:知乎浏览量:145次

  • 灵活的分析数据生命周期?

    灵活的分析数据生命周期?

    受监管实验室数据完整性指南的要求之一是数据生命周期,涵盖监管记录的生死。数据生命周期在最近的MHRA数据完整性指南中定义为“从生成和记录……查看详情

    发布时间:2018.12.27来源:数据治理浏览量:176次

  • 大数据对社会有多大用处?

    大数据对社会有多大用处?

    规范性分析是商业智能(BI)中使用的四种大数据类型之一。大数据是一个描述大量数据的术语-结构化和非结构化-这些大量数据淹没了企业或任何数……查看详情

    发布时间:2018.12.29来源:数据治理浏览量:156次

  • 元数据治理—从数据的源头开始

    元数据治理—从数据的源头开始

    将题目分为两部分——元数据和数据治理时,元数据治理最容易理解。询问任何擅长元数据管理的组织(或提供他们的数据,信息和记录的完整文档),无……查看详情

    发布时间:2019.06.20来源:简书浏览量:219次

  • 数据治理的伦理 - “数据带来利益和负债”

    数据治理的伦理 - “数据带来利益和负债”

    数据从未像现在这样强大。2018年发现了一些历史上最大的数据泄露事件,包括万豪酒店集团违规行为和剑桥分析公司丑闻,两者都对国际关系产生了……查看详情

    发布时间:2019.03.12来源:亿信华辰浏览量:154次

  • 数据治理和流分析的关系

    数据治理和流分析的关系

    借助流分析,可以通过智能数据模型和算法快速处理传入数据,以致在许多情况下,流数据没有机会被存储。与传统的分析过程相比,这是一个重要的变化……查看详情

    发布时间:2021.04.23来源:亿信数据治理知识库浏览量:152次

  • 云中的数据治理

    云中的数据治理

    IT中心,内部部署基础架构变得越来越复杂和昂贵,并且需要高技能的人力,因此企业现在将其IT和数据科学功能转移到云。云计算承诺提供低成本存……查看详情

    发布时间:2019.02.21来源:亿信华辰浏览量:178次

  • 电力数据治理方案如何实施?要注意什么?

    电力数据治理方案如何实施?要注意什么?

    电力行业数据治理痛点,包括整体架构缺乏统一的数据中心,孤岛现象严重;数据治理方面缺乏统一的数据标准和数据质量关系;电力数据治理方案如何实……查看详情

    发布时间:2021.04.09来源:亿信数据治理研究院浏览量:707次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议