快速理解数据仓库、数据湖、数据工厂、数据中台

发布时间:2021.04.13来源:亿信数据治理知识库浏览量:210次标签:数据治理

数据仓库


数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策和信息的全局共享。


所谓面向主题,是指根据使用者实际需求,将不同数据源的数据在一个较高的抽象层次上做整合,所有数据都围绕某一主题来组织,例如:采购主题、生产主题、客户主题、销售主题等。


所谓集成性,是指数据仓库中存储的数据是来源于多个数据源的集成、汇总。由于原始数据来自不同的数据源,存储方式各不相同。要整合成为最终的数据集合,需要从数据源经过一系列抽取、清洗、转换的过程。


所谓相对稳定,是指数据仓库中存储的数据一般为“既成事实”的数据,也可理解为历史数据的一个快照,只做查询分析用,不允许修改。


所谓反映历史变化,是指数据仓库根据不断集成新的主题数据,反应出该主题的数据变化情况,例如:销售业绩完成情况。


数据湖


数据湖是将来自不同数据源、不同数据类型(结构化、半结构化、非结构化)的数据,以原始格式存储进行存储的系统,它按原样存储数据,而无需事先对数据进行结构化处理。有人认为数据湖是数据仓库的PLUS版,增强了数据存储的能力。而实际上,数据湖不简单是数据仓库一个技术上的升级,更重要的是数据管理思维的升级。数据仓库是需要事先定义好数据结构,然后是报表取数。而大数据的发展,数据形式越发多样化,传统数仓这种定义数据结构、取数、出表的模式,已经很难满足业务上的需求了。因此,数据湖以原始格式存储各种类型数据,以及按需进行数据结构化处理、数据清理、提供数据服务,以更加灵活的方式支持多种应用场景的能力越来越受到人们的欢迎。


数据工厂


前边提到的数据仓库和数据湖,重点侧重于数据的存储,本质上是“原材料”的存储系统,而要让数据发挥价值,就必须将这个“原材料”需要加工成用户需要的“产品”。数据工厂就是根据用户的需求,将原始数据进行加工、处理、清洗、转换、汇总等各种加工工序,生产出能够被用户直接使用的数据产品。数据工厂包含了多种数据处理的工具,以满足不同处理工序的作业需要,例如:数据源连接、数据同步、数据清洗、数据转换、数据工作流、数据目录、数据服务等等。


数据中台


数据中台就是数据湖+数据工厂的一个综合。但不同的是数据中台更注重数据应用,离业务更近,强调一个快速敏捷。


数据中台不仅关注原始数据的存储及处理加工,更侧重将数据处理过程中,常用的逻辑、算法、标签、模型进行沉淀,而形成一系列的“数据半成品”,然后根据前台业务的需要,快速生产出用户需要的“数据产品”。数据中台能力强弱,要看这个“数据半成品”积累的多少了。


在数据生产的整个链条中,对于如何筑湖、如何选址建厂、按什么工序加工、以及如何配送,这是技术部门的事情,而“数据半成品”的沉淀和积累,却不是技术能决定的了。因此,数据中台的建设更强调需求驱动、业务主导。


了解更多数据仓库、数据湖、数据工厂、数据中台、数据治理相关知识:https://www.esenruizhi.com/industry-news/data-governance.html

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 克服数据管理成功的最大障碍

    克服数据管理成功的最大障碍

    随着数据治理的重要性不断提升,数据管理员可能成为您组织的无名英雄。你在做什么来支持他们?……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:126次

  • 主动方法在数据治理的数据架构

    主动方法在数据治理的数据架构

    “数据架构是业务战略的物理实现,” 全球数据战略有限公司 EMEA首席顾问NigelTurner在DATAVER……查看详情

    发布时间:2019.01.16来源:亿信华辰浏览量:133次

  • 数据管理的演进:从响应业务到创造业务

    数据管理的演进:从响应业务到创造业务

    企业对数据的利用有三个阶段:响应运营,响应业务,创造业务。数据中台解决的是响应业务的问题,第三阶段“创造业务”,则需要AI中台。……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:133次

  • 当今困扰企业的三个最常见的数据问题

    当今困扰企业的三个最常见的数据问题

    各组织都在发生数据危机。虽然存在缺陷,但传统的数据管理方法(ETL和MDM)运行良好,因此可以产生一些数据感。但是数据收集的增长速度远远……查看详情

    发布时间:2019.02.13来源:企业浏览量:138次

  • 数据沿袭工具如何促进数据治理策略

    数据沿袭工具如何促进数据治理策略

    企业可以通过跟踪数据更改的方式和时间来加强数据治理工作。专家David Loshin就如何使用数据沿袭产品提供建议。……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:158次

  • 零售商的数据治理势在必行

    零售商的数据治理势在必行

    最好的零售商擅长推销商品。在顶级的实体和电子商务商店,产品组织巧妙,布置精美,色彩鲜明,使客户可以轻松找到他们想要的东西。做得好,商品推……查看详情

    发布时间:2018.12.27来源:亿信华辰浏览量:156次

  • 数据资产如何安全可追溯,你们应该这样做!

    数据资产如何安全可追溯,你们应该这样做!

    近年来,食品安全中提到产地的可追溯性,给许多生鲜打上了专属的身份证以便出现问题可以追根溯源。而这并不稀奇,在使用报表工具时处于数据安全考……查看详情

    发布时间:2021.03.12来源:知乎浏览量:168次

  • 企业级数据治理面临的挑战与对策

    企业级数据治理面临的挑战与对策

    数据治理是社会深度信息化的产物,显示数据正从独占转为共享、从封闭走向开放、从权力变成资源的趋势。目前国内外对其有多种定义,如数据治理是对……查看详情

    发布时间:2019.08.20来源:知乎浏览量:259次

  • 最全数据治理工具解析:数据治理工具的关键必备功能

    最全数据治理工具解析:数据治理工具的关键必备功能

    ​数据治理工具被定义为帮助创建和维护一组结构化策略、程序和协议的过程的工具,这些策略、程序和协议控制企业数据的存储、使用和管理方式。本文……查看详情

    发布时间:2021.07.22来源:亿信华辰数据治理浏览量:376次

  • 企业如何快速实现一个数据治理项目

    企业如何快速实现一个数据治理项目

    大数据治理是诸多数据问题的全面解决之道。企业只有建立了完整的大数据治理体系,保证数据的质量,才能够真正有效地挖掘企业内部的数据价值,对外……查看详情

    发布时间:2020.03.19来源:知乎浏览量:152次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议