数据治理为什么成为企业必备?
发布时间:2020.07.29来源:CSDN浏览量:142次标签:数据治理
基本概念
什么是数据治理?
答:又叫”数据管控”。引用《DAMA 数据管理知识体系指南》一书给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合(规划、监控和执行)。数据治理职能指导其他数据管理职能如何执行。
数据元:通过名称、格式、长度、定义值域等一系列属性描述的数据单元。
代码集:数据元的取值范围。
数据元类目:按照标准规范对数据元进行分类。
元数据:对数据资源的描述性信息(数据的数据)。例如数据表的字段就是描述这些数据表中数据的元数据。
元模型:定义各种元数据的结构以及元数据间的关系。
概述
元数据(Metadata) 使得用户可以掌握数据的历史情况,如数据从哪里来?流通时间有多长?更新频率是多大?数据元素的含义是什么?对它已经进行了哪些计算、转换和筛选等等。在需求不确定情况下,在瞬间万变的商业环境下,元数据可以更好的支持需求的变化,降低项目风险。
元数据按照适用场景可有以下两种区分:
- 技术元数据—-从开发的角度描述的元数据,应用于开发、管理和维护数据治理平台。
- 业务元数据—-从业务的角度描述的元数据,提供良好的语义层定义,更便于业务人员理解。
元数据贯彻于建立数据仓库的全过程,不仅仅只是TL过程。
元数据标准 不统一,各厂商、各软件采用不同的元数据标准。业界需要统一的标准,以便各个软件系统之间可以相互交换元数据。CWG 1.0 (Common Warehouse Metamodel Version 1.0) 就是一种,其定义一个描述数据源、数据目的、转换、分析的元数据框架,以及定义建立和管理数据仓库的过程和操作,提供使用信息的继承。目前宣布支持CWM的厂商包括:IBM、Oracle、Hyperion、Dimension EDI、Genesis IONA、HP、NCR和Unisys等。
CWM基于3个工业标准:
- UML - Unified Modeling Language,OMG建模标准;
- MOF - Meta Object Facility,OMG建立元模型和模型库的标准,提供在异构环境下的数据交换的接口;
- XMI - XML Metadata Interchange,OMG元数据交换标准。
数据分类
对每类数据进行治理时,关注点、方法以及效果都不同,需要区别对待。
数据分类 | 描述 |
---|---|
主数据(Master Data) | 关于业务实体的数据 |
事务数据(Transactional Data) | 业务运营过程中的内部或者外部事件或者交易记录 |
参考数据(Reference Data) | 用于将其他数据进行分类或者目录整编的数据 |
元数据(Metadata) | 描述数据的数据 |
统计分析数据(Analytical Data) | 指对企业业务活动进行统计分析的数据 |
主数据 关注的是”人”和”物”,主数据管理是数据治理领域一个专门的话题,其主要目的是对关键业务实体(如员工、客户、产品、供应商等)建立统一视图,让客观世界里本是同一个人或物,在数据世界里也能做到唯一识别,而不是在不同系统、不同业务中成为不同的人或物。
事务数据 关注的是”事”,事务数据没有形成单独的数据治理领域,由于事务数据是BI分析的基础,因此往往在数据质量管理中重点关注。
参考数据 是更细粒度的数据,是对”人”“事”“物”的某些属性进行规范性描述的,对参考数据的管理一般会与主数据管理同时进行,或与BI数据质量管理同时进行,因为指标维度和维值直接影响到BI数据质量。
元数据 是一个包罗万象的概念,其本质是为数据提供描述,所以任何数据都有元数据。数据治理领域的元数据,更多是指BI、数据仓库这个范畴内的元数据(国际上有Common Warehouse Meta-model规范),此外还有信息资源管理的元数据(如Dublin core协议)、地理信息元数据、气象元数据等等。正因为如此广泛,也造成了从业者对其有极高的预期以及实践后的极大失落。
现在极少谈”元数据”,而是谈”数据定义”,谈数据必谈定义,但却又不将其作为专门一类数据来管理,在数据治理领域单独做元数据管理,收效甚微。 主要原因有两点:
- 数据生产与数据管理脱节,元数据管理更多是在数据生产的事后进行元数据收集和应用展现,对数据生产起到的管控作用极小;
- 工具自身问题:虽然很多工具都号称支持CWM规范,但元数据自动获取始终是技术难题,而且对于存储过程、自定义脚本很难自动解析和获取,就无法准确、完整展现细节的数据处理过程。
统计分析数据 ,目前BI系统建设的主要作用就是做各种指标和报表的计算和展示。统计分析数据往往是数据治理的重点,统计分析数据的数据流分析、统计分析数据的数值的波动性、平衡性监控,几乎是各个企业做数据治理的必备应用。
-
数据治理如何推动医疗大数据的发展
数据治理是一种管理数据的方法,允许组织平衡两个需求:收集和保护信息的需求,同时从信息中获取价值。但它远不止于此。医疗大数据其中的健康数据……查看详情发布时间:2019.08.15来源:知乎浏览量:102次
-
大数据技术学习,深度挖掘大数据的现状分析
企业级技术 = 艰苦的工作 其实大数据有趣的是它不是直接可以炒作的东西。 能够获得广泛兴趣的产品和服务往往是那些人们可以触摸……查看详情发布时间:2019.03.20来源:亿信华辰浏览量:109次
-
谈谈数据治理是什么?
数据治理这项工作一直都是存在的,和数据库设计的三范式一样都是为了数据的管理。数据治理是一整套完整的组织、制度、技术管理行为。……查看详情发布时间:2021.03.06来源:人人都是产品经理浏览量:118次
-
大数据资产管理总体框架概述
随着大数据时代的来临,对数据的重视提到了前所未有的高度,“数据即资产”已经被广泛认可。数据就像企业的根基,是各企业尚待发掘的财富,即将被……查看详情发布时间:2019.02.21来源:知乎浏览量:305次
-
国内成熟的数据治理解决方案提供商
如今,数据已成为企业的货币,但管理数据不当可能会很快失去控制。麻省理工学院最近的一项研究发现,对于一些企业来说,大数据正在变成糟糕的数据……查看详情发布时间:2019.11.25来源:CSDN浏览量:147次
-
安全数据交换方案已成为信息化建设的重要发展方向
为保护重要数据和应用系统的安全,目前各级政府部门普遍采用多个网络并行的方式。但是随着信息化建设的不断深入,不同网络之间或不同安全域之间的……查看详情发布时间:2020.08.21来源:知乎浏览量:71次
-
数据交换平台的功能结构设计与实现
数据交换平台是数据中心与其它应用系统沟通的桥梁,是进行数据交换的枢纽站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按……查看详情发布时间:2020.08.06来源:知乎浏览量:163次
-
2018 数据管理成熟度技术曲线:DataOps、dbPaaS、ML
数据运维(DataOps)、私有云数据库平台即服务(dbPaaS)和具有机器学习(ML)功能的数据管理在2018年Gartner数据管理……查看详情发布时间:2019.03.05来源:亿信华辰浏览量:119次
-
数据治理的方法论是什么?
一套科学、完整的实施方法论,可以为用户建立一套适应用户业务需求,并且操作性强的主数据管理体系。遵循该方法路线进行数据治理工作可以大大缩减……查看详情发布时间:2019.06.14来源:欣思博述数字化浏览量:98次