大数据治理平台建设过程

发布时间:2019.08.19来源:CSDN浏览量:292次标签:数据治理

一、数据治理架构
分为三个层次,分别为战略与治理保障、大数据管理和大数据应用与服务,其中战略与治理保障包括,数据战略规划与评估,数据治理组织与职责、数据制度与管理流程;大数据管理包括数据标准管理、架构与模型管理、质量管理、生存周期管理以及安全管理;大数据应用与服务包括,数据分析、开放共享以及数据服务。该架构依照国标数据管理能力成熟度模型设计。

二、数据质量问题的发现与整治过程
过程共分为三个阶段:源业务系统数据分析、制定质检规则并分析源系统数据,分析质量问题影响并制定整改措施。

源业务系统数据分析阶段的分析素材:源系统操作手册、需求分析说明、数据库设计、源系统数据;

分析过程:分析业务流程、逻辑和关系,确定数据库表间和字段间关系,同时分析与该源业务系 统存在关联关系的其它系统间的业务关联关系和数据关联关系;
输出成果:数据库结构(主外键、约束、表间关系、字段长度与类型等)、业务描述(表及字段的业务含义、业务规则)。
数据质量检查阶段的输入:分析阶段的输出成果以及业务报表;
过程:编制质检规则,并以其为核心,设计质检程序或脚本,执行自动化、批量化检查。过程中对重点业务报表引用的数据表进行重点分析;
输出:质量问题清单及问题定位。
数据质量分析阶段的输入:分析阶段和检查阶段的输出成果;
过程:分析质量问题对报表的影响,即影响分析;成因分析;制定解决方案;
输出:分析报告及整改方案。
数据质量分析报告将是后续大数据治理平台的重要建设依据。

三、数据标准建设过程
建设基础数据标准和指标数据标准框架;确定标准化范围,对重要指标(属性)进行标准化。
建设过程:该过程需要业务人员和技术人员共同参与梳理和编制,补充完善标准化方案。

基础数据标准框架的内容: 可参考人民银行数据标准规范,进行划分,包括业务属性、技术属性和管理属性三大类,业务属性包括标准主题、标准大类、标准子类、标准小类、标准中文名、标准英文名、业务定义、业务规则、融合规则、叔都是服我、与相关标准关系、标准来源及依据;技术属性包括数据类型、数据格式、代码编码规则、取值范围;管理属性包括标准定义者、标准管理者、标准使用者、反馈结果描述、标准应用领域和使用系统;

指标标准建设:筛选重要业务指标()=>制定指标标准框架(确定指标分类体系、属性形成标准化定义模板)=>制定指标标准(指标定义、口径、规则、数据来源,技术部门定义标准化属性,业务部门修订和确认指标标准)

指标数据标准框架:业务属性、技术属性和管理属性。

四、建设数据平台

层次关系:属性(字段)=>实体(对象,表)=>专题(实体集合,业务专题)=>主题   (专题集合、业务域)   
模型演进过程:基础模型=>逻辑模型=>物理模型。基础模型的形成,需要依据国家或行业标准,结合具体实施单位的业务情况进行裁剪,通过保留、增加和合并的业务匹配过程,形成基础模型,划分业务主题模型框架;在进行逻辑模型设计过程中,需要复制(系统间业务含义和字段名称均不相同的字段)、整合(含义相同名称不同的字段)和拆分(含义不同名称相同的字段);之后进行属性匹配,保留、增加、合并、拆分和映射源系统到基础模型中主题、实体和属性。

完成模型设计之后,进行数据映射和ETL操作,将源表数据,参照映射文件、开发规范和加载策略,进行ETL开发和操作,将数据填充至目标表中;通过以上操作,完成整合层建设,整合层的对数据应用的意义:统一的业务视图、明细的数据、全面的数据、稳定的数据模型、完整的历史数据。

汇总层,即满足共性的数据访问需求,抽取公共指标,形成由维度和指标组成的维度模型,对符合要求的数据进行预汇总和加工。

原文地址:https://blog.csdn.net/junweishiwo/article/details/82757205

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2019年数据保护政策趋势展望

    2019年数据保护政策趋势展望

    在全球数据保护法律政策中,欧美仍将扮演引领性角色。欧盟“e-PR”或带来更严格规制。美国联邦与地方隐私立法互补。……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:125次

  • 数据治理要处理好四个关系

    数据治理要处理好四个关系

    随着我国大数据战略的不断推进,各类生产生活行为都以数据的形式全景留痕,构建了一个与现实空间平行的“数据空间”,数据治理呼之欲出。要切实发……查看详情

    发布时间:2020.04.09来源:知乎浏览量:119次

  • Spring Boot、微服务架构和大数据治理三者之间的故事

    Spring Boot、微服务架构和大数据治理三者之间的故事

    微服务的诞生并非偶然,它是在互联网高速发展,技术日新月异的变化以及传统架构无法适应快速变化等多重因素的推动下诞生的产物。……查看详情

    发布时间:2019.01.07来源:亿信华辰浏览量:126次

  • 数据治理:推动结果的引擎

    数据治理:推动结果的引擎

    组织成功取决于某些与共同业务目标一致的构建块。这些构建块包括业务活动,数据和分析。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:150次

  • 数据驱动,高效的数据质量管理才是是重中之重

    数据驱动,高效的数据质量管理才是是重中之重

    给领导汇报工作时,你是否对报告的基础数据质量产生过担忧,担心质量不达标呢?大数据时代数据的核心不是“大”,而在于“有价值”,而有价值的关……查看详情

    发布时间:2019.05.06来源:亿信华辰浏览量:181次

  • 2021公安数据治理的目标

    2021公安数据治理的目标

    公安数据治理的目标是实现全局数据资源的有效整合,有效解决公安力量分散、资源分割、信息孤岛、运行封闭等问题,最终打破部门壁垒和警种壁垒。……查看详情

    发布时间:2021.04.29来源:亿信数据治理知识库浏览量:333次

  • 业务系统的数据资产管理为什么这么难?

    业务系统的数据资产管理为什么这么难?

    如果你做过BI或大数据,一定会接触数据资产管理的一些概念,比如元数据,数据字典,血统分析等等,但你会发现,要做好大数据平台的数据资产管理……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:152次

  • 什么是数据治理

    什么是数据治理

    什么是数据治理数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混……查看详情

    发布时间:2018.09.13来源:浏览量:142次

  • 数据治理、数据管理、数据管控

    数据治理、数据管理、数据管控

    数据治理、数据管理、数据管控这三个名词在一定程度上的确是有所重叠的,容易混为一谈,所以就造成了在实际使用中,经常将这三个词语“混着用”、……查看详情

    发布时间:2021.03.06来源:知乎浏览量:179次

  • 数据科学的下一个「超能力」:模型可解释性

    数据科学的下一个「超能力」:模型可解释性

    很多人重视重视模型的预测能力,却忽略了模型可解释性的重要性,只知其然而不知其所以然。为什么说模型的可解释性这么重要呢?作者就 5 个方面……查看详情

    发布时间:2019.03.28来源:亿信华辰浏览量:128次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议