什么是数据标准?如何制定数据标准?这份指南送上
发布时间:2020.09.29来源:头条浏览量:97次标签:数据治理
数据标准的定义
数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。简述之,即数据标准(Data Standards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。
用通俗一点的话来讲,我们需要在组织内定义一套关于数据的规范,好让我们都能理解这些数据的含义。比如在银行业,对于“客户”这个字段,往往不同部门的理解都会出现偏差,可能客户部就认为“客户”就是办了他们银行的卡的人,而网银部认为是在他们的银行网站注册过、或者通过这个银行转账的人都属于客户。就这样没有统一标准的话,不仅增加沟通成本,而且项目实施、交付、信息共享、数据集成、协同工作往往会出现各种问题,这些花了大代价的数据就体现不出应有的价值。
而数据标准管理就是将这一套数据标准,通过各种管理活动,推动数据进行标准化的一个过程,是数据标准落地必不可少的过程。
数据标准的分类
数据标准是进行数据标准化、消除数据业务歧义的主要参考依据。数据标准的分类是从更有利于数据标准的编制、查询、落地和维护的角度进行考虑的。
数据标准有多种分类,对于不同的分类方式,均可采用以元数据为数据标准制定的基本单元构建数据标准体系。
数据可以分为基础类数据和指标类数据。基础类数据指业务流程中直接产生的,未经过加工和处理的基础业务信息。指标类数据是指具备统计意义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算而得到。相应地,数据标准也可以分为基础类数据标准或指标类数据标准。
基础类数据标准是为了统一企业所有业务活动相关数据的一致性和准确性,解决业务间数据一致性和数据整合,按照数据标准管理过程制定的数据标准。指标类数据标准一般分为基础指标标准和计算指标(又称组合指标)标准。基础指标具有特定业务和经济含义,且仅能通过基础类数据加工获得,计算指标通常由两个以上基础指标计算得出。并非所有基础类数据和指标类数据都应纳入数据标准的管辖范围。数据标准管辖的数据,通常只是需要在各业务条线、各信息系统之间实现共享和交换的数据,以及为满足监控机构、上级主管部门、各级政府部门的数据报送要求而需要的数据。
在基础类数据标准和指标类数据标准这个框架下,可以根据各自的业务主题进行细分。细分时应尽可能做到涵盖企业的主要业务活动,且涵盖企业生产系统中产生的所有业务数据。以银行业的基础类数据标准和指标类数据标准分类为例,基础类数据标准分为客户数据标准、产品数据标准、协议数据标准、渠道数据标准、交易数据标准、财务数据标产数据标准、公共代码数据标准、机构和员工数据标准、地域和位置数据标准等。指标类数据标准包括监管合规指标、客户管理指标、风险管理资产负债指标、营销管理指标、综合经营指标等。如图:
数据标准的制定过程
数据标准作为全组织级的规范,会全面考虑企业的业务系统现状、业务情况、未来发展、人员结构等多方面因素,制定过程也是相当严格的。制定过程如下图:
1、收集国标、行标、现有标准
收集该行业国家标准、行业标准,收集途径是标准委员会官网、行业协会网站
梳理组织现有标准,通过《数据标准调研表》收集信息,形成组织现有标准文档
2、制定初版数据标准
与IT部门数据管理岗进行讨论,按主题划分,制定初版的数据标准
3、数据标准的审核
按照标准的归口管理部门,与相应的归口管理部门的数据管理专员进行逐条讨论,从数据标准的合理性、是否能落标、是否符合业务发展等多个角度对标准进行审核,最终得到定版标准
4、定版标准的发布
向数据治理委员会汇报定版标准,内部发布,收集反馈,对数据标准进行维护与更新。
数据标准管理的经验总结
亿信华辰在数据标准领域沉淀多年,近3年来,为超过100家政府或企业提供过数据标准化服务,尤其是在金融、政务行业积累丰富的实施经验,不仅拥有功能全面的产品支撑,且有完善的方法论来指导,在面临各种复杂场景下的数据标准管理,也能很好的应对,为数据标准项目的落地保驾护航。
企业级的数据标准管理系统旨在解决线下手工标准管理模式造成的低效且缺乏统一发布、同步更新和实时响应的问题。它实现了对数据标准的全流程的统一管理,集中涵盖了标准建立、变更、查询、映射管理和流程管理等功能。部分产品截图:
亿信华辰成功的项目经验值得各大企业在数据标准化建设规划中重点考虑,具体包含以下三方面的内容:
组织比制度重要。建立完善的数据标准管理组织是做好数据标注化工作的必要条件,只有建好了数据标准的组织,数据标准化的过程才能获得有效支撑;
未来比现在重要。在建立数据标准体系过程中,不能过于考虑现状,只考虑解决眼前问题,而忽视未来的业务发展;
人比系统重要。数据标准化的过程也不能过于严苛,不能死板的要求业务系统必须进行标准化改造,这样往往会导致项目失败。而是应该多方人员的诉求,综合考虑数据标准化的推进速度。
-
数据治理工作的难点主要体现在那些方面?
由哪个部门主导;人员应该怎样配置;各个数据治理角色的职责分别是什么。这些一定需要明确,一个职责分工明确的团队将更好的推进数据治理工作。建……查看详情发布时间:2019.09.18来源:知乎浏览量:110次
-
创新基础:智能数据治理是一项团队运动
对于任何希望创新其战略以提高运营效率,提高质量,优化人口健康管理或推动精准医疗的卫生系统而言,数据治理是必不可少的必备措施之一。……查看详情发布时间:2018.11.26来源:数据治理浏览量:95次
-
如何选择数据治理工具
有许多场景需要数据治理工具。在严格的行业法规下运营,利用分析软件和/或定期整合关键主题领域的数据的企业将发现自己正在寻找数据治理工具来帮……查看详情发布时间:2019.07.04来源:知乎浏览量:74次
-
大数据行业必备书目:《数据治理知识图谱》限量首发,0元领
为了让数据不再熵增,助力政企数字化转型,我们将此心血集结成册,行业首发《数据治理知识图谱》,DAMA中国区主席汪广盛倾情推荐,限量300……查看详情发布时间:2021.07.14来源:亿信华辰浏览量:97次
-
一文透露银行业的数据治理该不该做,又怎么做?
小宋最近同学会,一个大学同学就职银行信息科技部门,听说小宋也在一家大数据公司便拉起小宋的手要和她好好掰扯掰扯一下银行业的数据治理了。银行……查看详情发布时间:2020.07.29来源:今日头条浏览量:85次
-
8 项提高数据完整性的预防性措施
仅使用一种方法几乎不可能将数据完整性风险降至最低,因此使用多种策略的组合是更好的选择。降低数据完整性风险的一些最有效方法包括8点。……查看详情发布时间:2021.07.07来源:亿信华辰数据治理知识库浏览量:529次
-
睿治元数据管理系统如何助力解决元数据管理难题
亿信华辰睿治数据治理平台先进的产品设计理念,充分依照国际规范、标准,具有国内先进水平。其广泛应用了MQ、分布式计算、zookeeper等……查看详情发布时间:2021.08.13来源:亿信华辰浏览量:111次
-
银行数据治理-数据治理是银行业面对的一个崭新课题
本书是“银行业信息化丛书”之一,数据治理是银行业面对的一个崭新课题,本书从银行业数据基本概况、数据治理现状,以及银行业数据治理体系、数据……查看详情发布时间:2018.11.29来源:数据治理浏览量:100次
-
元数据:数据治理的燃料
企业渴望从可提供竞争优势的数据中获取洞察力。实现这一目标的最常见障碍是数据质量差。如果输入到预测算法的数据是“脏的”(具有丢失或无效的值……查看详情发布时间:2019.08.02来源:知乎浏览量:84次
-
2019—开启你的数据治理道路
如今,数字系统正在生产越来越多具有公认价值的数据,数据治理正变得越来越受欢迎和必要。然而,并非所有数据都被视为相同。……查看详情发布时间:2019.06.28来源:知乎浏览量:100次