有效数据治理的6大原则
发布时间:2019.10.17来源:知乎浏览量:82次标签:数据治理
如果你常常对数据准确性而烦恼,大部分时间都用于处理数据而不是对业务进行思考分析的话,那么你需要好好对数据进行治理了。
一、为什么要进行数据治理
不知道你是否有这样的感受,看到数据后,一脸懵逼,不知道各个表和字段代表什么意思,再看看别的同事写的SQL,一条SQL语句有几百行,各种表关联,然后问了其中一个同事,他说“别提了,数据都不准,我快被数据折磨死了!”,此时你是不是“想死”!欲哭无泪……
究其背后的原因,是因为负责的人只是问题使然,哪有问题哪里去补,没有整体的统筹规划,一步错,步步错,数据最后是越来越重,查询越来越复杂,数据准确性还没有人敢打保票,同时修复的难度也大大增加。
二、如何进行数据治理
如果要想将数据治理好的话,需要遵循以下六大原则、合理制定数据中间表模型以及埋点采集到应用全流程的把控。
1. 六大原则
原则1:关键概念多方共识
关键概念若涉及多方,比如成交客户的定义,要确保公司内部和客户相关的所有业务人员理解一致。
你或许会说,成交客户还不好理解么,就是购买了我公司产品且签署合同的用户就是一个成交客户,但是实际情况远非如此,笔者当时处理该块的业务时,问不同的业务人员得到的结果都不一样,这样就造成了数据指标统计的歧义甚至数据的不准确。
当一个合同主体变换名称(含工商注册名称变更、更换签约公司等),那么这个客户算一个成交客户吗?
同一个 集团/公司 下,不同的 子公司/业务线/部门 用同一个名字签署多个不同合同,属于单个成交客户还是多个成交客户?
当合同还在「待确认」或未拿到合同编号时,如果客户运营人员已经开始服务客户,那么这个客户算一个成交客户吗?……
原则2:某个类型的值经常发生变动,则需要冗余一个通用字段冗余值
笔者是深受其害,以前每个月底都需要找开发、业务人员对一遍数据,举个例子:
查询原始指标:soure_type为A,B的任务产出的金币数额为消费指标,SQL已针对该指标做了类型筛选。某一天业务运营人 员上线新的任务,C类型的任务会贡献金币流水,但是开发未告知数据人员,导致原来的关键指标数值出现差错。
处理过数据的同学都知道,某个指标的实现可能和其它几个关键指标相关,那么该指标的异常排查就需要逐个检查是哪个相关指标出问题了,查找到原因可能2,3天的时间就没了,但如果事先开发人员冗余了一个通用字段代表该类消费指标,那么后续不管业务人员上线多少个消费类型的任务,都不会对原来的指标产生影响。
原则3:每个实体都有唯一、不变的ID,最好没有实际意义
一是为了实体的唯一性,二是为了表关联或更新时不受业务的影响。
原则4:涉及协作的数据,发现问题要从修改源头做起,保证下一次拿到正确的数据
协作的数据可以说是一个串联的过程,源头的数据会逐层影响下层的数据,不要为了一时方便,只修改目前发现问题的地方,要从修改源头做起,方便他人即方便自己。
原则5:编写操作清单,操作前请三思
数据间存在关联,把数据间的关联关系陈列清楚、注意事项标注清楚,操作前一一核对,小数据量验证无错后,大数据量执行。
原则6:系统工程的方法管理数据,尽可能使用系统,监控数据错误并及时修复。
将使用数据的相关方都画在一张系统循环图中,观察数据错误产生于系统哪个环节,如何影响后续各个环节,避免恶性循环的产生。
-
治理成熟度差距以及如何克服它
了解您在真正的IG成熟度方面的立场,并在自己和团队中识别变革的阻力。不要回避要求定期审核和验尸以评估进度和后续步骤。通过具体信息,您可以……查看详情发布时间:2019.03.13来源:亿信华辰浏览量:87次
-
最终有人把数据治理的元数据、主数据等概念讲明白了
数据治理就是以服务组织战略目标为基本原则,通过组织成员的协同努力,流程制度的制定,以及数据资产的梳理、采集清洗、结构化存储、可视化管理和……查看详情发布时间:2022.06.24来源:小亿浏览量:201次
-
案例研究:亚利桑那州实施全州数据治理模型
亚利桑那州战略企业技术办公室(ADOA-ASET) - 亚利桑那州管理局状态数据管理架构师Jeff Wolkove和能力成熟度模型研究所……查看详情发布时间:2018.12.06来源:Amber Lee Dennis浏览量:89次
-
大型传统企业如何利用数据管理系统把握好业务和数据的关系,逐步实现智能化转型?
关于“数据治理”的定义各大研究学派给出的都概念不尽相同,但看了这么多不同的说法小亿翻译成人话,其实就是要搞清楚:数据治理治什么?谁来治?……查看详情发布时间:2020.08.31来源:亿信华辰浏览量:72次
-
数据治理之道帮助企业完成数字化转型
数据治理不能再只是面向数据部门了,需要成为面向全企业用户的工作环境,需要以全企业用户为中心,从给用户提供服务的角度,管理好数据的同时为用……查看详情发布时间:2020.06.28来源:知乎浏览量:92次
-
你认为你知道什么是数据治理吗?
数据治理是当今一个相对较新且非常热门的话题。因此,毫不奇怪,对数据治理的定义有多种不同的定义。大多数这些定义都是自我服务……查看详情发布时间:2018.11.19来源:丹尼尔舒勒浏览量:79次
-
数据管理能力成熟度评估模型
数据管理能力成熟度评估模型,中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会发布。……查看详情发布时间:2019.09.02来源:GB/T36073—2018浏览量:295次
-
如何搭建数据质量管理平台
数据往往在一个企业是相当于一个重要资产,企业在经营的过程中也会积累不少各类数据,这类数据后期也可通过归纳、提炼从而进行深度挖掘分析,给企……查看详情发布时间:2019.07.30来源:知乎浏览量:96次
-
银监会拟要求银行业金融机构加强数据治理
银行业金融机构将数据治理纳入公司治理范畴,明确数据管理和数据质量控制的要求,鼓励银行业金融机构开展制度性探索,结合实际情况设置首席数据官……查看详情发布时间:2019.10.18来源:新华网浏览量:95次
-
金融服务的数据治理2.0
随着金融服务业面临特别的压力,数据驱动型业务的变化速度正在增加。对于银行,信用卡,保险,抵押贷款公司等,必须正确地进行数据治理。……查看详情发布时间:2019.01.25来源:亿信华辰浏览量:86次