数据治理、共享交换、数据仓库、数据中心的关系

发布时间:2019.08.07来源:CSDN浏览量:215次标签:数据治理

建数据中心离不开数据,以前设计数据库都是从事务性数据库考虑(做的都是业务系统,思维模式太固定了),没有从数据仓库的角度来统管分析。以下是从数据仓库的角度考虑数据中心的建设:

 

政府的数据中心建设基本就包括这几个步骤:
1、数据源:支持不同部门的各类来源数据,包括文件型、数据库型、Http服务型和JMS消息型,可以读取各类数据
2、数据汇聚:这里是通过软件实现原始数据的读取存储,将不同的数据都存储到各自的数据库;因为保证与每个部门不发生扯皮的问题,所以必须保证读取的原始数据是对的,要独立存储不做任何加工,组织就按照同步的部门科室进行存放;所以就对应数据仓库的ODS层
3、数据处理:这里是对汇聚的原始数据进行初步的ETL处理,实现对数据的清洗、加工,补全各类信息(包括编码字典解释等),这个步骤的目的是实现数据的规范化,这里的数据也是落地存储物理库,作为抽取中间库DWD层
4、数据融合:这里是对规范化的原始数据进行融合处理,建立数据之间的关系模型,比如抽取成独立的人口库模型:

 

数据融合主要是按照一个业务领域进行数据建模。
5、数据集市:是对领域模型数据进行汇总统计分析,将统计分析的结果进行存储,简单解释可以理解为一般业务统计的中间表(提高统计效率,将统计成果进行定期存储),当然这里不止这么点,结合现在时髦的大数据分析,也就是将分析结果在集市层存储,为上层应用提供数据源。
6、最后一个是核心的元数据库,这里的元数据核心要存储以上4个库的表及字段元数据,可以实现整个数据处理过程的追溯。

从以上分析,了解共享交换的同学,可能直接就说了上面的数据汇聚、数据处理不就是传统的交换吗?只是换了一个说法;这个说法也没问题,只是这里是从政府业务和数据仓库的角度来说,传统的交换是直接将原始数据文件读取到后进行了ETL处理,形成交换库;这里是从政府安全追责的角度分析,形成2个步骤;所以数据中心的建设是包括数据交换的,只是交换处理的思路在变化。
从数据处理到数据融合,这里是要创建业务模型,按照业务模型进行数据处理,处理的工具一般也是ETL工具;所以共享交换只是强调了软件技术,没有从整体进行规划,它只是真个数据中心建设里的一个技术工具之一。
从数据融合到数据集市,又有几种形态:1、传统的数据统计,2、数据挖掘,3、大数据分析;这几种技术都可以形成数据集市的数据。

数据治理是一个更大的概念:

 

在数据仓库的基础上,更加强调数据的质量与数据安全;现在的数据治理也是叫大数据治理,是大数据建设的基础,毕竟是强调大数据平台里的核心,数据部分。只有数据是可依靠的,才能用来做大数据分析,否则就是无源之水了,谁也不敢相信。
数据质量,核心就是要依靠元数据的管理;来实现整个数据处理过程的跟踪,知道目标数据的源头可以一步步的追溯到数据的提供者。
数据中心则是一个业务上的叫法,包括机制规范、相关软件、数据、处理过程的构建,都是数据中心建设的步骤。数据中心就是通过数据治理形成可以对外统一提供服务的数据。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业数据质量管理的水平、直接影响数字化转型的进程!

    企业数据质量管理的水平、直接影响数字化转型的进程!

    企业在数字化转型的过程中,需利用云计算、大数据、移动互联和物联网技术,通过新的产品和服务、新的业务模式和新的关系创造价值和竞争优势。数字……查看详情

    发布时间:2019.08.01来源:知乎浏览量:170次

  • 数据治理到底应该怎么治?

    数据治理到底应该怎么治?

    数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点……查看详情

    发布时间:2020.07.07来源:知乎浏览量:150次

  • 基于大数据架构的医院数据中心管理

    基于大数据架构的医院数据中心管理

    医疗数据较为复杂,以医院来说建设的业务系统接近百来个,例如HIS系统、急诊系统、护理系统、电子病历系统、检验系统、检查系统、输血系统、生……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:131次

  • 在AHIMA的医疗保健信息治理框架内

    在AHIMA的医疗保健信息治理框架内

    医疗保健一直在与信息治理斗争。这并不奇怪,考虑到有多少数据以及它来自多少不同的源。美国健康信息管理协会希望改变这种状况。……查看详情

    发布时间:2019.01.15来源:亿信华辰浏览量:174次

  • 数据治理分析项目最佳实践

    数据治理分析项目最佳实践

    当今信息化建设程度不断深入,企业在优化整合各种IT能力,使IT成为企业的前进驱动力与核心竞争力的同时,将视角关注于更深层次的数据治理与分……查看详情

    发布时间:2019.08.08来源:CSDN浏览量:180次

  • 新形式的治理需要安全和道德地解锁数据价值

    新形式的治理需要安全和道德地解锁数据价值

    尽管今天的数据非常丰富,但其中大部分仍处于孤岛状态,这意味着需要新的治理结构来打开它并释放其对社会的潜在价值。……查看详情

    发布时间:2019.03.21来源:亿信华辰浏览量:124次

  • 云中的数据治理

    云中的数据治理

    IT中心,内部部署基础架构变得越来越复杂和昂贵,并且需要高技能的人力,因此企业现在将其IT和数据科学功能转移到云。云计算承诺提供低成本存……查看详情

    发布时间:2018.12.29来源:亿信华辰浏览量:160次

  • 数据治理计划阶段

    数据治理计划阶段

    所有程序都有生命周期。……查看详情

    发布时间:2019.03.29来源:亿信华辰浏览量:128次

  • 当今困扰企业的三个最常见的数据问题

    当今困扰企业的三个最常见的数据问题

    各组织都在发生数据危机。虽然存在缺陷,但传统的数据管理方法(ETL和MDM)运行良好,因此可以产生一些数据感。但是数据收集的增长速度远远……查看详情

    发布时间:2019.02.13来源:企业浏览量:131次

  • 一个通用的数据中台架构应该如何构建,本文告诉你答案

    一个通用的数据中台架构应该如何构建,本文告诉你答案

    这两年,越来越多的大数据从业者提到“数据中台”的概念。在信息系统建设工作中,我们熟知系统可以分为前台和后台,但什么是中台,每个人的理解并……查看详情

    发布时间:2020.09.14来源:小亿浏览量:137次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议