快速理解数据仓库、数据湖、数据工厂、数据中台

发布时间:2021.04.13来源:亿信数据治理知识库浏览量:165次标签:数据治理

数据仓库


数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策和信息的全局共享。


所谓面向主题,是指根据使用者实际需求,将不同数据源的数据在一个较高的抽象层次上做整合,所有数据都围绕某一主题来组织,例如:采购主题、生产主题、客户主题、销售主题等。


所谓集成性,是指数据仓库中存储的数据是来源于多个数据源的集成、汇总。由于原始数据来自不同的数据源,存储方式各不相同。要整合成为最终的数据集合,需要从数据源经过一系列抽取、清洗、转换的过程。


所谓相对稳定,是指数据仓库中存储的数据一般为“既成事实”的数据,也可理解为历史数据的一个快照,只做查询分析用,不允许修改。


所谓反映历史变化,是指数据仓库根据不断集成新的主题数据,反应出该主题的数据变化情况,例如:销售业绩完成情况。


数据湖


数据湖是将来自不同数据源、不同数据类型(结构化、半结构化、非结构化)的数据,以原始格式存储进行存储的系统,它按原样存储数据,而无需事先对数据进行结构化处理。有人认为数据湖是数据仓库的PLUS版,增强了数据存储的能力。而实际上,数据湖不简单是数据仓库一个技术上的升级,更重要的是数据管理思维的升级。数据仓库是需要事先定义好数据结构,然后是报表取数。而大数据的发展,数据形式越发多样化,传统数仓这种定义数据结构、取数、出表的模式,已经很难满足业务上的需求了。因此,数据湖以原始格式存储各种类型数据,以及按需进行数据结构化处理、数据清理、提供数据服务,以更加灵活的方式支持多种应用场景的能力越来越受到人们的欢迎。


数据工厂


前边提到的数据仓库和数据湖,重点侧重于数据的存储,本质上是“原材料”的存储系统,而要让数据发挥价值,就必须将这个“原材料”需要加工成用户需要的“产品”。数据工厂就是根据用户的需求,将原始数据进行加工、处理、清洗、转换、汇总等各种加工工序,生产出能够被用户直接使用的数据产品。数据工厂包含了多种数据处理的工具,以满足不同处理工序的作业需要,例如:数据源连接、数据同步、数据清洗、数据转换、数据工作流、数据目录、数据服务等等。


数据中台


数据中台就是数据湖+数据工厂的一个综合。但不同的是数据中台更注重数据应用,离业务更近,强调一个快速敏捷。


数据中台不仅关注原始数据的存储及处理加工,更侧重将数据处理过程中,常用的逻辑、算法、标签、模型进行沉淀,而形成一系列的“数据半成品”,然后根据前台业务的需要,快速生产出用户需要的“数据产品”。数据中台能力强弱,要看这个“数据半成品”积累的多少了。


在数据生产的整个链条中,对于如何筑湖、如何选址建厂、按什么工序加工、以及如何配送,这是技术部门的事情,而“数据半成品”的沉淀和积累,却不是技术能决定的了。因此,数据中台的建设更强调需求驱动、业务主导。


了解更多数据仓库、数据湖、数据工厂、数据中台、数据治理相关知识:https://www.esenruizhi.com/industry-news/data-governance.html

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据交换管理平台-数据交换的枢纽站

    数据交换管理平台-数据交换的枢纽站

    数据交换平台是数据中心与其它应用系统沟通的桥梁,是进行数据交换的枢纽站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按……查看详情

    发布时间:2020.04.23来源:知乎浏览量:121次

  • 元数据管理在数据仓库中的应用

    元数据管理在数据仓库中的应用

    随着业务系统每年收集和使用的数据飞速增长,数据体量日趋增长,数据形态多样化且不统一,多种数据源之间的采集、传播和共享遇到困难。元数据管理……查看详情

    发布时间:2022.05.06来源:小亿浏览量:190次

  • 2021 年 10 大数据治理工具

    2021 年 10 大数据治理工具

    数据治理工具被定义为帮助创建和维护一组结构化策略、程序和协议的过程的工具,这些策略、程序和协议控制企业数据的存储、使用和管理方式。本文将……查看详情

    发布时间:2021.07.22来源:亿信华辰数据治理知识库浏览量:770次

  • 2019年需要关注的三个治理趋势

    2019年需要关注的三个治理趋势

    通过精心应用RPA,优先考虑数据质量,并迎合不断变化的劳动力构成,数据专业人员可以有效地指导他们的组织进入数据驱动的未来。……查看详情

    发布时间:2018.12.20来源:亿信华辰浏览量:91次

  • 大数据:产业链条将更为完备

    大数据:产业链条将更为完备

    2018年,我国大数据产业呈现健康快速发展态势,包括大数据硬件、大数据软件、大数据服务等在内的大数据核心产业环节产业规模有望达到5700……查看详情

    发布时间:2019.02.20来源:亿信华辰浏览量:101次

  • 应用程序组合管理:有效管理您的投资组合

    应用程序组合管理:有效管理您的投资组合

    现在是时候关注您的投资组合阶段的实际管理了。在这里,您需要考虑应用程序的成本效益和风险可接受性。您应该采用主观业务决策,识别问题和/或机……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:97次

  • 数据治理技术措施

    数据治理技术措施

    企业构建的信息系统以满足功能应用为主,如果没有整体数据架构,应用系统就没有数据标准可参考,不可避免地会出现不同的应用系统使用不同的数据标……查看详情

    发布时间:2020.10.21来源:知乎浏览量:126次

  • 云管理与云治理

    云管理与云治理

    混合云或多云已成为当今组织IT战略的重要组成部分。作为多云战略的一部分,组织需要定义如何在多个云中管理,控制,操作,优化和保护云基础架构……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:162次

  • 大数据环境下数据质量管理面临的挑战

    大数据环境下数据质量管理面临的挑战

    随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:148次

  • 业务流程建模与标准操作过程之间的联系

    业务流程建模与标准操作过程之间的联系

    我们上周开始了一个关于业务流程(BP)建模及其在企业中的角色的新博客系列。本周的重点是业务流程建模和标准操作过程之间的联系。具体而言,使……查看详情

    发布时间:2019.02.18来源:亿信华辰浏览量:107次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议