普及元数据和主数据的联系与定义
发布时间:2020.08.31来源:CSDN浏览量:130次标签:数据治理
在数据治理中,我们总是会听到元数据和主数据,我们今天就可以来说说什么是元数据,什么是主数据。
1、元数据(metadata)
描述数据的数据,对数据及信息资源的描述性信息
大部分属性字段就是元数据。比如,性别,国籍,出生省份等。这个是最接近自然意义的的数据。
(1)在数据仓库领域中,元数据按用途分成:
业务元数据:提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据
技术元数据:支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。
(2)具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:
描述哪些数据在数据仓库中;
定义要进入数据仓库中的数据和从数据仓库中产生的数据;
记录根据业务事件发生而随之进行的数据抽取工作时间安排;
记录并检测系统数据一致性的要求和执行情况;
衡量数据质量。
(3)基于应用,可以将元数据分成以下的若干种。
数据结构:数据集的名称、关系、字段、约束等;
数据部署:数据集的物理位置;
数据流:数据集之间的流程依赖关系(非参照依赖),包括数据集到另一个数据集的规则;
质量度量:数据集上可以计算的度量;
度量逻辑关系:数据集度量之间的逻辑运算关系;
ETL过程:过程运行的顺序,并行、串行;
数据集快照:一个时间点上,数据在所有数据集上的分布情况;
星型模式元数据:事实表、维度、属性、层次等;
报表语义层:报表指标的规则、过滤条件物理名称和业务名称的对应;
数据访问日志:哪些数据何时被何人访问;
质量稽核日志:何时、何度量被稽核,其结果;
数据装载日志:哪些数据何时被何人装载
(4)元数据的基本管理
元模型管理
通过可视化的用户体验实现:
a.元模型添加、删除、修改、发布等维护功能;
b.了解已有元模型的分类、统计、使用情况、变更追溯
c.每个元模型的生命周期管理等等。
元数据管理
元数据管理实现针对元数据的基本管理功能。
元数据的添加、删除、修改属性等维护功能;
元数据之间关系的建立、删除和跟踪等关系维护功能;
提供元数据发布流程管理,可以更好地管理和跟踪元数据的整个生命周期;
元数据自身质量核查、元数据查询、元数据统计、元数据使用情况分析、元数据变更、元数据版本和生命周期管理等功能。
元数据分析
元数据分析功能主要实现针对元数据的基本分析功能。包括血缘分析(血统分析)、影响分析、实体关联分析、实体影响分析、主机拓扑分析、指标一致性分析等。
2、主数据(Master Data)
主数据(MD Master Data)指系统间的共享数据(例如,客户、供应商、账户和组织部门相关数据)。与记录业务活动,波动较大的交易数据相比,主数据(也称基准数据)变化缓慢。在正规的关系数据模型中,交易记录(例如,订单行项)可通过关键字(例如,订单头或发票编号和产品代码)调出主数据。主数据必须存在并加以正确维护,才能保证交易系统的参照完整性。
从报告或维度建模角度看,主数据指基于其组织或配置指标的维度或层次,而不是实际情况或其自身测量结果。例如,收入、成本和利润是实际情况,而时间、地点、客户和供应商是维度。
主数据和元数据的关系
主数据跟元数据的关系,举个例子的话就想是一本书,主数据就是书里边的正文,实际有用的数据,元数据就是书的目录,是索引,方便你找到主数据的。
好啦!大家明白了什么是主数据和元数据了吗!
-
数据质量提升的必要性
高质量的数据对管理决策,业务支撑都有极其重要的作用。有些项目在初期由于并没有考虑数据质量的因素,导致了项目实施后期才发现,由于数据质量问……查看详情发布时间:2022.02.18来源:小亿浏览量:514次
-
企业如何提升数据质量?
在这个大数据时代,数据资产逐渐成了构成成企业核心竞争力的关键要素,然后,大数据的应用必须建立在高质量的数据上才有意义,因此提供数据质量是……查看详情发布时间:2019.07.26来源:知乎浏览量:77次
-
您不应该进行数据治理的3个理由
今天有很多关于数据治理的讨论。但令人惊讶的是,今天“进行数据治理”的组织数量并不高。在我看来,数据治理是现代数据驱动型企业的必备条件。但……查看详情发布时间:2018.12.13来源:数据治理浏览量:90次
-
增强数据管理吸引了更多企业的兴趣
“我认为数据专业人员确实希望机器处理繁琐且计算密集的东西,”Henschen说。“有很多工作要做,让机器处理他们最擅长的事情,这将使人类……查看详情发布时间:2019.03.07来源:亿信华辰浏览量:91次
-
业务词汇表和元数据:数据治理和词汇表准备
我经常被问到“我们如何捕获数据词汇表资产”和“我们是否已准备好与数据管理员合作?”我的回答始终是:如果您能说明数据治理计划的目标并拥有赞……查看详情发布时间:2018.12.21来源:数据治理浏览量:99次
-
数据清理的终极指南——亿信华辰
我花了几个月的时间分析来自传感器、调查及日志等相关数据。无论我用多少图表,设计多么复杂的算法,结果总是会与预期不同。……查看详情发布时间:2019.03.20来源:数据清理浏览量:80次
-
企业级数据治理面临的挑战与对策
数据治理是社会深度信息化的产物,显示数据正从独占转为共享、从封闭走向开放、从权力变成资源的趋势。目前国内外对其有多种定义,如数据治理是对……查看详情发布时间:2019.08.20来源:知乎浏览量:162次
-
安全数据交换方案已成为信息化建设的重要发展方向
为保护重要数据和应用系统的安全,目前各级政府部门普遍采用多个网络并行的方式。但是随着信息化建设的不断深入,不同网络之间或不同安全域之间的……查看详情发布时间:2020.08.21来源:知乎浏览量:63次
-
企业如何开展数据治理项目
从大的阶段来看,数据治理主要分为存量数据“由乱到治”的阶段,以及增量数据严格按照规章制度实施确保“行不逾矩”的运营阶段。在“由乱到治”的……查看详情发布时间:2020.06.30来源:知乎浏览量:85次