企业数据治理的坑你遇到过哪些?
发布时间:2019.09.12来源:知乎浏览量:86次标签:数据治理
数据治理当前大部分的立项都是信息技术部门,原因在于业务部门往往觉得数据治理和我没什么关系,技术部门大多是以数据中心或者大数据平台为出发点,受限于组织范围,不希望扩大到业务系统,只希望把自已负责的范围管好。
这种情况呈现出的状态,即客户遇到了数据质量的问题,也意识到要通过数据治理来解决,很多时候,客户所立的项目就叫数据治理,殊不知数据治理是一个很大的概念(这里指广义的数据治理),包括很多内容,想在一个项目里就做完是不可能的,很多人认为我们只做了元数据、数据质量、数据标准,内容不算多,但其实内容真的不少。很容易导致最后哪个也做不好,用不起来。
1.客户的需求不太明确
客户想了解数据治理,并且想花大价钱去做数据治理,必定是因为数据存在很大问题,很多脏数据导致分析得不好看,但是做什么,如何去做,做多大的范围,先做什么后做什么,达到什么样的目标,业务部门、技术部门、厂商之间如何配合做等等,很多客户其实并没有想清楚自已真正想解决的问题。于是,数据治理,很难找到一个切入点。
2.数据治理是技术部门的事
很多业务人员认为,数据治理是技术部门的事,但是其实数据产生问题,往往是来自源头,也就是业务人员,业务人员录入数据不规范或者缺失,导致数据产生各种问题,很多表面上的技术问题,如ETL过程中某代号变更导致数据加工出错,影响报表中的数据正确性等,在本质上其实还是业务管理的不规范。
在跟客户沟通交流的时候,会发现很多客户可能不知道数据产生问题的根本原因,只想通过技术去把数据治理好,错误数据治理正确,缺失数据补全,希望通过清洗去将数据治理好,然后分析得美观,但其实我们在治理数据的同时,需要去制订规范,去规范我们的数据,把错误数据扼杀在摇篮里,这样我们在治理数据的同时,能保证后面录入的时候不会再有错误数据,避免进入死循环,这就需要各个部门,技术和业务齐心协力,共同维护数据问题。
3.大而全的数据治理
出于投资回报的考虑,客户往往倾向于做一个覆盖全业务和技术域的、大而全的数据治理项目。从数据的产生,到加工、应用、销毁,数据的整个生命周期他们希望都能管到。从业务系统,到数据中心,到数据应用,里面的每个数据他们希望都能被纳入到数据治理的范围中来。
客户一般想要把数据治理做全,全生命周期的一个管理,从采集,到治理,到清洗,到分析,到销毁,从业务系统,到数据中心,到数据应用,里面的每个数据他们希望都能被纳入到数据治理的范围中来。但其实数据治理很广,想要在一个项目里面把数据治理做全是很难的,具体到实时层面要考虑各个因素,实施周期会比较长,所以会有一期、二期分批地去实现,我们需要引导客户,遵循2/8原则——80%的问题产生于20%的系统和数据——从最核心的系统、最重要的数据、最容易产生问题的地方开始着手做数据治理,进而推广到其他系统,把数据治理做全
对于企业而言,有效的数据治理是必不可少的,当企业在数据方面出现问题,无法为企业高层做分析决策提供数据支撑时,数据治理的启动势在必行,选择合适的时机启动数据治理,是避免决策出现重大失误的有效手段。目前国内能做数据治理的公司有亿信,普元、石竹等,其中亿信做这一块起步较早,已经有成熟的产品和解决方案
亿信华辰自主开发的睿治数据治理平台包含以下功能:
元数据:元数据是数据治理的基础,是对数据的描述,可总览分析元数据之间的关系和互相之间的影响。
数据标准:数据标准是对数据进行统一的、规范的定义,确保数据在复杂数据环境中保持一致性、规范性,提高数据管控的效率,完善数据治理体系。
数据质量:数据质量包括对数据质量规则的定义、数据质量检查方案的定义,支持定时自动执行质量检查,自动生成质检报告,监控并揭示数据质量问题,提供问题明细查询和质量改进建议。
数据处理:数据处理主要用于对数据进行清洗、转换、整合、模型管理等处理工作,既可以用于对数据问题进行可行的修正,也可以用于为数据应用提供可靠的数据模型。
主数据:主数据是对需要共享的数据建立的统一管理,为各业务系统数据调用提供黄金数据。
数据资产:数据资产是将全部数据作为资产,进行不同角色的目录化管理,分析数据资产之间的关系,获知资产访问、利用情况等。
数据交换:数据交换用于实现不同机构不同系统之间的数据传输交换,完成基本的数据汇集,确保数据在传输中的完整性、一致性。
数据生命周期:对数据的全生命周期进行管理,主要是根据设置对数据进行自动归档和销毁,对近线数据和离线数据分别管理。
数据安全:数据安全贯穿于数据治理全过程,用于保证数据的安全性,提供对隐私数据的加密、模糊化处理。
睿治平台主要目的是发现并解决数据问题,通过一系列措施规范数据,减少数据问题发生,整体提高数据的应用价值。将实现业务目标作为数据管理和服务的核心驱动力,优化数据架构,提升数据仓库/信息化管理系统建设,支持管理能力的提高、精细化和决策的科学性。
-
企业如何建立主数据管理平台让数据增值
90年代中期,ERP兴起并得到快速发展。然而,最早的ERP系统中并没有主数据(Masterdata)的概念,而是被称作基础数据。基础数据……查看详情发布时间:2020.08.28来源:知乎浏览量:109次
-
不是专业数据分析师的你,该如何科学地看待大数据呢?
似乎很多创业人,都喜欢讲一些概念化的东西。例如前两年的互联网+,例如后来的大数据,又例如最近的区块链…………查看详情发布时间:2019.02.13来源:亿信华辰浏览量:54次
-
方法论:如何从0到1搭建企业级主数据管理平台
一个完整的主数据管理方案应该包括:主数据管理体系建设、主数据管理系统建设,这两个层面。主数据体系建设是企业数据管理的核心,是标准化数据的……查看详情发布时间:2021.05.13来源:亿信数据治理知识库浏览量:83次
-
如今的大数据究竟发展到了什么阶段
大数据时代,大数据分析与应用大肆盛行。越来越多的大公司大企业大集团,都越来越重视大数据的影响和作用。……查看详情发布时间:2019.03.19来源:亿信华辰浏览量:81次
-
外部管理数据集的政府数据可靠性
当我在退伍军人事务部工作时,我联系了许多人 - 联邦政府以外的人 - 他们希望在联邦政府开放数据工作时帮助清理,使用和改进公共数据集。当……查看详情发布时间:2019.03.08来源:亿信华辰浏览量:79次
-
大数据治理的语义方法
正如Coyne所说:“数据治理正在成长为一套实践,软件和系统是其中不可或缺的一部分。但他们只是其中的一部分。您在更高层次上拥有的是实践和……查看详情发布时间:2019.03.05来源:亿信华辰浏览量:105次
-
数据信任是智能城市数据治理的一部分吗?
鉴于最近的丑闻,城市别无选择,只能紧急关注数据治理问题。数据信任可以成为解决方案的一部分吗?……查看详情发布时间:2019.03.25来源:亿信华辰浏览量:68次
-
企业数据治理项目中影响数据质量的5个因素
数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情发布时间:2020.04.08来源:知乎浏览量:86次
-
建立统一的数据交换平台实现各部门的数据共享
要实现各部门的数据共享,必须先建立统一的数据交换平台,通过交换平台实现各异构数据库之间的数据集成,实现原有各业务系统在数据级集成,保证异……查看详情发布时间:2020.08.21来源:知乎浏览量:85次