数据治理、共享交换、数据仓库、数据中心的关系

发布时间:2019.08.07来源:CSDN浏览量:209次标签:数据治理

建数据中心离不开数据,以前设计数据库都是从事务性数据库考虑(做的都是业务系统,思维模式太固定了),没有从数据仓库的角度来统管分析。以下是从数据仓库的角度考虑数据中心的建设:

 

政府的数据中心建设基本就包括这几个步骤:
1、数据源:支持不同部门的各类来源数据,包括文件型、数据库型、Http服务型和JMS消息型,可以读取各类数据
2、数据汇聚:这里是通过软件实现原始数据的读取存储,将不同的数据都存储到各自的数据库;因为保证与每个部门不发生扯皮的问题,所以必须保证读取的原始数据是对的,要独立存储不做任何加工,组织就按照同步的部门科室进行存放;所以就对应数据仓库的ODS层
3、数据处理:这里是对汇聚的原始数据进行初步的ETL处理,实现对数据的清洗、加工,补全各类信息(包括编码字典解释等),这个步骤的目的是实现数据的规范化,这里的数据也是落地存储物理库,作为抽取中间库DWD层
4、数据融合:这里是对规范化的原始数据进行融合处理,建立数据之间的关系模型,比如抽取成独立的人口库模型:

 

数据融合主要是按照一个业务领域进行数据建模。
5、数据集市:是对领域模型数据进行汇总统计分析,将统计分析的结果进行存储,简单解释可以理解为一般业务统计的中间表(提高统计效率,将统计成果进行定期存储),当然这里不止这么点,结合现在时髦的大数据分析,也就是将分析结果在集市层存储,为上层应用提供数据源。
6、最后一个是核心的元数据库,这里的元数据核心要存储以上4个库的表及字段元数据,可以实现整个数据处理过程的追溯。

从以上分析,了解共享交换的同学,可能直接就说了上面的数据汇聚、数据处理不就是传统的交换吗?只是换了一个说法;这个说法也没问题,只是这里是从政府业务和数据仓库的角度来说,传统的交换是直接将原始数据文件读取到后进行了ETL处理,形成交换库;这里是从政府安全追责的角度分析,形成2个步骤;所以数据中心的建设是包括数据交换的,只是交换处理的思路在变化。
从数据处理到数据融合,这里是要创建业务模型,按照业务模型进行数据处理,处理的工具一般也是ETL工具;所以共享交换只是强调了软件技术,没有从整体进行规划,它只是真个数据中心建设里的一个技术工具之一。
从数据融合到数据集市,又有几种形态:1、传统的数据统计,2、数据挖掘,3、大数据分析;这几种技术都可以形成数据集市的数据。

数据治理是一个更大的概念:

 

在数据仓库的基础上,更加强调数据的质量与数据安全;现在的数据治理也是叫大数据治理,是大数据建设的基础,毕竟是强调大数据平台里的核心,数据部分。只有数据是可依靠的,才能用来做大数据分析,否则就是无源之水了,谁也不敢相信。
数据质量,核心就是要依靠元数据的管理;来实现整个数据处理过程的跟踪,知道目标数据的源头可以一步步的追溯到数据的提供者。
数据中心则是一个业务上的叫法,包括机制规范、相关软件、数据、处理过程的构建,都是数据中心建设的步骤。数据中心就是通过数据治理形成可以对外统一提供服务的数据。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2021金融数据治理案例分享

    2021金融数据治理案例分享

    2021年,分析机构BARC在一项研究中对全球378家公司进行了调查,96%的受访企业认为,数据治理已经不可或缺,而且未来将继续在企业中……查看详情

    发布时间:2021.04.09来源:数据治理研究院浏览量:250次

  • 实施数据治理 - 学到3个主要经验教训

    实施数据治理 - 学到3个主要经验教训

    尽管数据治理在开发过程中可能会有些流动和迭代,但遵循最佳实践并设计精心定位的路线图有助于确保成功。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:171次

  • 数据治理:清洁客户数据的注意事项

    数据治理:清洁客户数据的注意事项

    根据相关研究显示,超过50%的企业花在清理数据上的时间比实际使用时要多,确保数据质量对营销成功至关重要。……查看详情

    发布时间:2019.06.28来源:知乎浏览量:115次

  • 深度思考:从BERT看大规模数据的无监督利用

    深度思考:从BERT看大规模数据的无监督利用

    在击败 11 个 NLP 任务的 State-of-the-art 结果之后,BERT 成为了 NLP 界新的里程碑, 同时打开了新的思……查看详情

    发布时间:2019.02.20来源:亿信华辰浏览量:253次

  • 并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    我们生活在一种数据驱动的文化中 - 毫无疑问。从智能手机到拖拉机,我们周围的几乎所有东西都会产生某种形式的数据。为了使事情更具挑战性,数……查看详情

    发布时间:2019.08.02来源:知乎浏览量:144次

  • 如何成功实现一个数据治理项目,大神详细拆解实施要点

    如何成功实现一个数据治理项目,大神详细拆解实施要点

    此文将主要围绕数据治理项目具体阐述实施步骤、工具平台的功能,并基于实践经验,提出数据治理成功的要素。全文有点长,非常实用的干货,建议收藏……查看详情

    发布时间:2021.05.26来源:亿信数据治理知识库浏览量:965次

  • 数据治理的血缘分析

    数据治理的血缘分析

    数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合(聚合)的一个手段,通过血缘分析实现数据融合处理的可追溯。……查看详情

    发布时间:2019.11.22来源:CSDN浏览量:191次

  • 数据治理最佳实践利用大数据

    数据治理最佳实践利用大数据

    大数据时代的新兴技术,如人工智能和物联网,意味着有更多的数据可以从中受益,并且数据治理策略可以管理和保护。……查看详情

    发布时间:2019.06.28来源:知乎浏览量:167次

  • 数据湖中的数据管理与治理

    数据湖中的数据管理与治理

    当您转换到数据湖时,选择完全集成的数据湖泊管理平台将使您对数据充满信心,并对其进行扩展以包含越来越多的用户和有利于业务的用例。毕竟,这就……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:175次

  • 2019年的数据前景如何

    2019年的数据前景如何

    这三个与数据相关的趋势今年值得关注。 公司喜欢技术堆栈所有层的“即服务”模式,从云供应商提供的基础架构到完整的SaaS应用程序。但是……查看详情

    发布时间:2019.01.07来源:数据治理浏览量:143次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议