数据治理:让数据质量更好

发布时间:2019.02.12来源:亿信华辰浏览量:110次标签:数据治理

数据治理

大数据时代数据产生的价值越来越大,基于数据的相关技术、应用形式也在快速发展,开发基于数据的新型应用已经成为高校信息化建设的一个重点领域。当前各大厂商、用户都在探索与数据相关的开发技术、应用场景和商业模式,最终目的就是挖掘数据价值,推动业务发展,实现盈利。目前数据应用项目非常多,但真正取得预期效果的项目少之又少,而且开发过程困难重重,其中的一个重要原因就是数据质量问题导致许多预期需求无法实现。如果没有数据治理,再多的业务和技术投入都是徒劳的,因为很经典的一句话:Garbage in Garbage out。数据治理是保证数据质量的必需手段,从全球范围来看,加强数据治理提升数据质量已成为企业提升管理能力的重要任务。

数据治理是一个系统的、大型的、长期的工程,大型企业已经开始了实施,并取得了一定成果,但目前高校在数据治理方面还没有开始真正意义上的实践,究其原因,一方面高校还没有把数据治理的重要性提升到战略高度,另一方面没有将数据治理单独作为课题研究,没有形成系统的实施方。本文从管理和技术两方面出发探索适合高校信息化建设的数据治理方法,形成包含组织、制度、标准、流程、安全、技术等内容的数据治理方案,从而打造高校绿色数据生态环境,为数据应用提供基础保障。

数据治理并不是一个新生事物,可以说,有数据的地方就存在数据治理,只不过随着数据应用的迅猛发展将它提到了一个高度,作为一个独立的研究领域。数据治理并没有标准的、严格的定义,概况地讲,所有为提高数据质量而展开的业务、技术和管理活动都属于数据治理范畴。

数据治理的英文是Data Governance,《DAMA 数据管理知识体系指南》一书给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。数据治理职能指导其他数据管理职能如何执行,图1说明了数据治理与其他几个数据管理职能的关系。

数据治理是技术与管理相结合的一套持续改善管理机制,贯穿在数据管理的整个过程中,通常包括了组织架构、政策制度、技术工具、数据标准、流程规范、监督及考核等方方面面,将其他几个数据管理职能贯穿、协同在一起,让企业的数据工作成为一个有机整体而不是各自为政。数据治理涉及的IT技术主题众多,包括元数据管理主数据管理、数据质量、数据集成、监控与报告等。

仅仅依靠技术手段,以建设系统的方式是难以有效解决数据治理面临的所有问题。构建数据治理体系是数据治理工作的基础,为了有序实施数据治理,应采用规划先行的原则,制定适合高校业务特点的管理流程,选择可行的技术方案和实施工具,明确数据治理的工作机制和工作内容,稳步推进数据治理各项工作,数据治理体系框架如图2所示。

战略:数据治理是在高校发展战略和规划的指导下进行实施的,这些战略和规划包括业务发展目标、IT规划以及数据治理相关的发展规划。

机制:机制是数据治理工作实施的基础保障,通过组织、制度、流程的建设和执行得以落实。机制是数据治理工作的重点,数据治理执行效果就是机制落实的效果。

专题:数据治理专题是数据治理的工作内容,包括数据标准、数据治理、元数据、主数据、数据生命周期等方面。

实施:数据治理工作最终在相关制度、规范和流程下通过数据治理组织借助技术手段和管理手段来实现。包括系统开发阶段为提高数据质量进行的校验设计;系统日常运维工作;数据分析应用阶段的数据集成;数据质量监控等。

毋庸置疑,数据是高校的宝贵资产,各高校已经意识到数据质量的重要性,但是并没有将数据治理提到战略高度,信息化建设的重点仍然是应用系统建设和运维。数据治理是一个系统工程,需要管理层、系统开发人员、系统使用人员、系统维护人员多方协作才能进行。目前最大的问题就是各方人员对数据治理的认识还处于盲区,他们并没有意识到数据治理的重要性,因此数据治理首先要从上到下全面提高思想认识,保证在系统建设、系统运行、系统维护各个环节都能重视数据治理。

健全的数据治理组织是全面开展数据治理工作的基础,数据治理组织应包括管理人员、业务人员和技术人员,缺一不可。数据治理组织可以设置三种角色,数据治理委员会、数据治理业务组、数据治理技术组。

数据治理委员会:由校领导、IT部门负责人和业务部门负责人组成,负责制定数据治理的目标、制度、规范、流程、标准等,沟通协调,解决相关人员责、权、利问题,推行数据治理文化。

数据治理业务组:由业务部门业务专家、业务部门系统管理员组成,负责业务系统参数、基础数据维护,保证系统正常使用;负责审核、检查、整改业务数据,在数据产生源头提高数据质量。

数据治理技术组:由IT部门的相关技术人员组成,包括系统开发人员、数据治理人员、数据库管理员。系统开发人员负责系统数据录入功能符合数据校验标准和数据治理标准;数据治理人员负责开发数据质量检测规则、监控数据质量、批量修改数据等工作;数据库管理员负责系统数据的备份、恢复、安全、审计等工作。

一般来说,信息化建设应遵循标准先行的原则,在应用系统建设初期就应该制定高校内部数据标准体系,保证各业务部门、各业务系统使用相同的数据标准,提高部门间、系统间数据共享能力,避免形成信息孤岛。数据标准体系包括数据标准、技术标准、管理标准、数据质量标准等内容,可以成立由业务人员和技术人员组成的数据标准制定小组,负责数据标准体系的制定、维护、宣传、解释等工作。

由于高校缺乏明确的数据质量管控规范、流程,导致数据治理相关人员职责划分不清,缺乏专职人员在不同阶段对数据质量负责。通过制定数据质量管控规范,使相关人员明确在数据产生、存储、应用整个生命周期中数据治理包含的工作内容和工作流程,形成校内统一管理体系。为了提高数据治理执行效率,有必要建立数据治理绩效考核,检验数据治理各个环节的效果。

保障数据安全是高校信息化的首要工作,高校应该制定贯穿于数据生命周期的数据安全管理制度,包括数据生成及传输、

数据存储、数据处理及应用、数据销毁四个方面。安全管理制度主要用来规范员工在日常工作中安全地使用数据,并且指导技术人员如何实施数据安全工作。

高校构建的信息系统以满足功能应用为主,如果没有整体数据架构,应用系统就没有数据标准可参考,不可避免地会出现不同的应用系统使用不同的数据标准和数据库,导致数据交换、数据共享困难,数据冗余、数据完整性、数据一致性等问题突出。

理想情况下,高校在信息化初期就应该规划整体数据架构。一个完整的高校数据架构主要包括:数据标准、数据库产品线、主数据、元数据、数据质量、数据安全、数据交换、数据仓库。每一部分都需要作为独立的专题去建设,而且必须是技术与管理相结合的建设过程,最终形成高校全局数据架构。

产生数据质量问题的第一个环节就是生成数据的源系统,在数据源头解决数据质量问题是提高数据质量非常有效的措施。加强信息系统设计和开发可以通过系统功能自动地规避大量数据质量常见问题。具体包括以下三个方面:

加强数据库设计,使用3NF范式构建业务系统数据模型可以通过数据库有效解决数据冗余、不一致等问题;

系统开发阶段加强数据录入功能的设计和开发,提高界面友好性和校验功能,可以有效解决数据完整性、时效性等问题。

学校内部不同应用系统、不同部门间需要共享数据的现象非常普遍,建立主数据中心不仅能避免各应用系统相互共享数据形成网状结构,同时能够保证对外提供准确、一致的数据。一般地,主数据是描述核心业务实体的数据,如教师、学生、科研成果、资产等,这些数据变化相对缓慢并通常跨业务重复使用。这里我们结合实际需求情况扩大了主数据的范围,凡是需要交换、共享的数据都纳入到主数据范围,形成全校范围内一致的、完整的、准确的核心业务数据,统一由主数据中心完成对外提供数据的任务。建立主数据中心不仅仅是技术工作,除开发、维护外还需要制定开发规范、管理规范、管理流程,共同规范主数据的使用。

通过搭建数据质量监控平台可以实现数据质量自动检查、监控,平台包括数据质量检查规则库、规则执行引擎、数据质量报告、报告推送功能。平台的核心是规则库,与业务无关的规则由技术人员独立开发,与业务相关的规则需要技术人员和业务人员共同确定检查规则,然后编写规则脚本。规则执行引擎可以定时批量执行检查规则,及时发现数据质量问题,将数据质量报告第一时间推送给业务人员,有助于及时纠正问题数据。

数据安全实施工作在数据安全管理制度的指导下执行,由技术人员完成,主要包括数据备份、恢复、脱敏、监控、审计等。

数据治理是高校信息化建设中提高数据应用水平和信息化管理水平的有效手段。数据治理是一项长期系统工程,贯穿于整个数据生命周期,不仅需要借助技术手段,更需要完善数据治理制度,包括规划、组织、机制、规范、流程等,只有全校各级人员高度重视和积极参与,逐步形成数据治理文化,数据治理才能取得成效,数据才能发挥更大的价值。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据清理的终极指南——亿信华辰

    数据清理的终极指南——亿信华辰

    我花了几个月的时间分析来自传感器、调查及日志等相关数据。无论我用多少图表,设计多么复杂的算法,结果总是会与预期不同。……查看详情

    发布时间:2019.03.20来源:数据清理浏览量:75次

  • 并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    并非所有数据都是平等的:为什么公司需要数据治理战略才能成功

    我们生活在一种数据驱动的文化中 - 毫无疑问。从智能手机到拖拉机,我们周围的几乎所有东西都会产生某种形式的数据。为了使事情更具挑战性,数……查看详情

    发布时间:2019.08.02来源:知乎浏览量:101次

  • 大数据时代传统工业企业的转型之路

    大数据时代传统工业企业的转型之路

    基于互联网与大数据的企业商业模式创新,使得传统的生产、流通和消费等环节呈现出前所未有的“信息化”、“扁平化”和“无界化”。借助于大数据的……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:79次

  • 企业如何快速启动数据治理项目?

    企业如何快速启动数据治理项目?

    大数据时代已经到来,各个政府机关,大中小企业都越来越重视数据的价值。然而在企业的运转过程中,却经常会产生各种各样的数据问题。……查看详情

    发布时间:2019.08.15来源:知乎浏览量:86次

  • 治理:如何做对

    治理:如何做对

    如果您在任何规模的组织中工作,您可能不得不与某种治理委员会打交道。这些都是出了名的狡猾。继续阅读,看看如何避免常见的陷阱。……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:75次

  • 数据治理:一些美好的开始

    数据治理:一些美好的开始

    数据治理增强了业务参与,共享理解,关注和协调,将日益脱节的数据环境结合在一起,并在许多EDM计划中提供数据值优化。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:80次

  • 建立统一的数据交换平台实现各部门的数据共享

    建立统一的数据交换平台实现各部门的数据共享

    要实现各部门的数据共享,必须先建立统一的数据交换平台,通过交换平台实现各异构数据库之间的数据集成,实现原有各业务系统在数据级集成,保证异……查看详情

    发布时间:2020.08.21来源:知乎浏览量:85次

  • 电力数据治理方案如何实施?要注意什么?

    电力数据治理方案如何实施?要注意什么?

    电力行业数据治理痛点,包括整体架构缺乏统一的数据中心,孤岛现象严重;数据治理方面缺乏统一的数据标准和数据质量关系;电力数据治理方案如何实……查看详情

    发布时间:2021.04.09来源:亿信数据治理研究院浏览量:375次

  • 从数据资产管理出发,看数据治理的最优架构如何搭建?

    从数据资产管理出发,看数据治理的最优架构如何搭建?

    通过数据治理工作的开展,数据变得可信且易于理解,并能有效地支撑业务人员的决策分析工作,数据资产也变得更易用,更有价值。……查看详情

    发布时间:2021.04.15来源:亿信数据治理知识库浏览量:103次

  • 数据治理与数据质量的关系

    数据治理与数据质量的关系

    单纯从数据层面来看,数据体系包括治理、管理和应用三个部分。治理是负责解决人与人之间的事,管理负责各个职能领域,应用则是价值的实现。不讨论……查看详情

    发布时间:2018.11.29来源:知乎浏览量:69次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议