数据治理、共享交换、数据仓库、数据中心的关系

发布时间:2019.08.07来源:CSDN浏览量:220次标签:数据治理

建数据中心离不开数据,以前设计数据库都是从事务性数据库考虑(做的都是业务系统,思维模式太固定了),没有从数据仓库的角度来统管分析。以下是从数据仓库的角度考虑数据中心的建设:

 

政府的数据中心建设基本就包括这几个步骤:
1、数据源:支持不同部门的各类来源数据,包括文件型、数据库型、Http服务型和JMS消息型,可以读取各类数据
2、数据汇聚:这里是通过软件实现原始数据的读取存储,将不同的数据都存储到各自的数据库;因为保证与每个部门不发生扯皮的问题,所以必须保证读取的原始数据是对的,要独立存储不做任何加工,组织就按照同步的部门科室进行存放;所以就对应数据仓库的ODS层
3、数据处理:这里是对汇聚的原始数据进行初步的ETL处理,实现对数据的清洗、加工,补全各类信息(包括编码字典解释等),这个步骤的目的是实现数据的规范化,这里的数据也是落地存储物理库,作为抽取中间库DWD层
4、数据融合:这里是对规范化的原始数据进行融合处理,建立数据之间的关系模型,比如抽取成独立的人口库模型:

 

数据融合主要是按照一个业务领域进行数据建模。
5、数据集市:是对领域模型数据进行汇总统计分析,将统计分析的结果进行存储,简单解释可以理解为一般业务统计的中间表(提高统计效率,将统计成果进行定期存储),当然这里不止这么点,结合现在时髦的大数据分析,也就是将分析结果在集市层存储,为上层应用提供数据源。
6、最后一个是核心的元数据库,这里的元数据核心要存储以上4个库的表及字段元数据,可以实现整个数据处理过程的追溯。

从以上分析,了解共享交换的同学,可能直接就说了上面的数据汇聚、数据处理不就是传统的交换吗?只是换了一个说法;这个说法也没问题,只是这里是从政府业务和数据仓库的角度来说,传统的交换是直接将原始数据文件读取到后进行了ETL处理,形成交换库;这里是从政府安全追责的角度分析,形成2个步骤;所以数据中心的建设是包括数据交换的,只是交换处理的思路在变化。
从数据处理到数据融合,这里是要创建业务模型,按照业务模型进行数据处理,处理的工具一般也是ETL工具;所以共享交换只是强调了软件技术,没有从整体进行规划,它只是真个数据中心建设里的一个技术工具之一。
从数据融合到数据集市,又有几种形态:1、传统的数据统计,2、数据挖掘,3、大数据分析;这几种技术都可以形成数据集市的数据。

数据治理是一个更大的概念:

 

在数据仓库的基础上,更加强调数据的质量与数据安全;现在的数据治理也是叫大数据治理,是大数据建设的基础,毕竟是强调大数据平台里的核心,数据部分。只有数据是可依靠的,才能用来做大数据分析,否则就是无源之水了,谁也不敢相信。
数据质量,核心就是要依靠元数据的管理;来实现整个数据处理过程的跟踪,知道目标数据的源头可以一步步的追溯到数据的提供者。
数据中心则是一个业务上的叫法,包括机制规范、相关软件、数据、处理过程的构建,都是数据中心建设的步骤。数据中心就是通过数据治理形成可以对外统一提供服务的数据。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据标准在数据治理中的意义

    数据标准在数据治理中的意义

    数据标准是为了规范系统建设时对业务的统一理解,增强业务部门、技术部门对数据的定义与使用的一致性。新系统建设应遵照(自主开发)或尽可能与数……查看详情

    发布时间:2020.04.28来源:知乎浏览量:139次

  • 数据治理准备的五大支柱:倡议赞助

    数据治理准备的五大支柱:倡议赞助

    “Facebook是全球数据治理的核心。”3月19日“华尔街日报”的一篇文章总结了我们所处的位置。在通用数据保护法规(GDPR)生效仅两……查看详情

    发布时间:2019.01.24来源:亿信华辰浏览量:158次

  • 关注:2019年大数据的10大发展趋势

    关注:2019年大数据的10大发展趋势

    如今,人们寻求获得更多的数据有着充分的理由,因为数据分析推动了数字创新。然而,将这些庞大的数据集转化为可操作的洞察力仍然是一个难题。而那……查看详情

    发布时间:2019.02.12来源:亿信华辰浏览量:116次

  • 企业主数据管理方案

    企业主数据管理方案

    主数据管理使得企业能够集中化管理数据,在分散的系统间保证主数据的一致性,改进数据合规性、快速部署新应用、充分了解客户、加速推出新产品的速……查看详情

    发布时间:2020.04.29来源:知乎浏览量:164次

  • 企业数字化转型关键 ,数据治理需要关注什么?

    企业数字化转型关键 ,数据治理需要关注什么?

    2019年我国数字经济规模为35.8万亿元,产业数字化占数字经济的比例达到80.2%。新经济领域的高度数字化,通过传导至传统产业的转型升……查看详情

    发布时间:2020.11.08来源:知乎浏览量:163次

  • 主数据管理项目之你的主数据如何做“主”

    主数据管理项目之你的主数据如何做“主”

    主数据的定义已经被我们说了太多,今天这篇文章就不说定义,我们聊聊主数据的项目如何实施,主数据如何做“主”。一、主数据建设的术法道随着企业……查看详情

    发布时间:2020.08.28来源:知乎浏览量:193次

  • 理解和证明数据治理2.0

    理解和证明数据治理2.0

    过去,证明数据治理的合理性是非常困难的。数据治理1.0的孤岛性质以及缺乏对增值的关注意味着买入率很低。……查看详情

    发布时间:2019.01.25来源:亿信华辰浏览量:221次

  • 数据治理成功的六个步骤

    数据治理成功的六个步骤

    毫无疑问,数据已经成为信息经济的原材料,而数据治理是一项战略迫切需要。 ……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:132次

  • 数据治理这项服务

    数据治理这项服务

    我们将再次讨论对有形资产和无形资产进行估值的讨论。……查看详情

    发布时间:2019.01.16来源:亿信华辰浏览量:157次

  • 来自园艺的5个数据治理课程

    来自园艺的5个数据治理课程

    所有这些数据增长和收购挑战都要求我们重新考虑我们的数据治理策略。我们根本没有确保正确管理和使用数据所需的可见性。我们的首要任务是消除风险……查看详情

    发布时间:2018.12.04来源:Debi Tadd浏览量:254次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议