数据治理困难,即数据治理之“困”。

发布时间:2020.01.03来源:知乎浏览量:71次标签:数据治理

当前,以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透。以数据为核心的数字化转型已是大势所趋。金融业是数据密集型行业,在生产经营过程中积累了海量的数据资源。如何做好数据治理,更快、更好地推进数字化转型。

首先,谈一谈我们面临的数据治理困难,即数据治理之“困”。

第一,存在信息孤岛,有数不能用。当前,金融业数据治理过程中普遍存在“不愿、不敢、不能”共享的问题,导致海量数据散落在众多机构和信息系统中,形成一个个“数据烟囱”。

一是不愿共享,多数机构都将数据作为战略性资源,认为拥有数据就拥有客户资源和市场竞争力,主观上不愿意共享数据;与之类似,机构内部数据权属分割,数据所有权和事权密切相关,部门宁愿将数据“束之高阁”,也不愿轻易拿出来共享。

二是不敢共享,部分金融数据具有一定敏感性,涉及用户个人隐私、商业秘密甚至国家安全,数据共享可能存在法律风险,客观上给机构间共享数据带来障碍。

三是不能共享,由于各机构数据接口不统一,不同机构的数据难以互联互通,严重阻碍数据开放共享,导致数据资产相互割裂、自成体系。(数据孤岛的产生不能怪数据所有者,因为数据产生的初衷肯定是自己用,而并不是为了让别人用,以后也会如此)

第二,数据质量不高,有数不好用。金融科技背景下,高质量数据成为金融服务与创新的重要基础,也是大数据提升金融精准施策能力的关键前提。然而,当前金融业整体数据质量不高现象依然突出,给数据深入挖掘与高效应用带来困难。

在完整准确性方面,由于缺乏统一的数据治理体系,有些金融机构在数据采集、存储、处理等环节可能存在不科学、不规范等问题,导致错误数据、异常数据、缺失数据等脏数据产生,无法确保数据的完整性和准确性。

在一致性方面,由于业务条线繁杂、业务种类多样,多个部门往往数据采集标准不一、统计口径各异,同一数据源在不同部门的表述可能完全不同,看似相同的数据实际含义也可能大相径庭,数据一致性难以保障。这给全局数据建模、分析、运用造成障碍,数据挖掘效果大打折扣。

第三,融合应用困难,有数不会用。金融数据来源众多、体量庞大、结构各异、关系复杂。从如此繁杂的海量金融数据中挖掘高价值、关联性强的高质量数据,需要高效的信息技术支撑和可靠的基础设施保障。然而,部分金融机构科技研发投入相对不足、科技人员占比严重失调,利用数据建模分析解决实际问题的能力有待提高。

信息资源利用大多停留在表面,数据应用尚不深入、应用领域相对较窄、数据与场景融合不够,导致数据之“沙”难以汇聚成“塔”,海量数据资源无法盘活,数据潜力得不到充分释放。

第四,治理体系缺失,有数不善用。我们常说,技术本身是中性的,技术运用的善恶完全取决于人,我认为这一结论对数据同样适用。科技要向善,数据也同样要向善。然而,由于法律法规尚不健全、数据治理体系还不完善、机构合规意识不足,数据“不善用”的问题较为突出。

从业机构违法违规成本低,为谋求商业利益而置现有管理规定于不顾,过度采集数据、违规使用数据、非法交易数据等问题屡见不鲜。例如,某些APP、网站,用户不授权提供手机号、通讯录、地理位置等信息,就无法继续使用和浏览,通过“服务胁迫”来达成“数据绑架”。

此外,部分机构数据保护意识、内部管理、技防能力薄弱,数据泄露事件时有发生,用户成为“透明人”,电信欺诈、骚扰电话、暴力催收等屡禁不止,严重侵害用户权益。

面对上述困难和挑战,金融业如何解困破局、实现数据有序治理和高效利用,是需要我们共同探讨的重点议题。下面,我谈一谈数据治理应遵循的基本原则,也就是数据治理之“道”。

一是依法合规,保障安全。数据作为重要的生产要素,确保数据安全应是始终恪守的底线。金融业是对信息安全高度敏感的行业,应建立健全数据安全管理长效机制和防护措施,严防数据泄露、篡改、损毁与不当使用,依法依规保护数据主体隐私权在数据治理过程中不受侵害,不能因开展跨部门数据融合应用而突破现有法律法规与监管规则。

二是物理分散,逻辑集中。由于历史原因,很多机构往往存在“N”个数据中心(数据源),呈现出多个业务条线数据分散存储、分散运行的局面,若采用“推倒重来”的方式显然成本太高、阻力太大。

因此,应在保持现有数据中心职能不变的前提下,维持当前数据物理存放位置和运行主体不变,充分利用各数据中心IT设施和人财资源,构建“1个数据交换管理平台+N个数据中心(数据源)”的数据架构格局。在此基础上,制定实施统一的数据管理规则,实现数据的集中管理。

三是最小够用,用而不存。数据治理的一大难点就是如何在保障数据所有权基础上实现数据的融合应用。应消除数据所有方因信息“所有权让渡”造成“事权转移”的顾虑,规范数据使用行为,严控数据获取和应用范围,确保数据专事专用、最小够用、未经许可不得留存,杜绝数据被误用、滥用。在满足各方合理需求前提下,最大限度保障数据所有方权益,确保数据使用合规、范围可控。

四是一数一源,一源多用。当前,无论是金融管理部门还是金融机构,各业务条线数据分散现象或多或少存在,数据多头收集时有发生。这不但增加信息报送、采集、存储成本,也导致数据责任主体不明,数据安全、数据质量难以保障。应明确源数据管理的唯一主体,保障数据完整性、准确性和一致性,减少重复收集造成的资源浪费和数据冗余。同时,建立数据规范共享机制,提升数据利用效率和应用水平,实现数据多向赋能。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 构建有效的数据科学团队

    构建有效的数据科学团队

    随着数据科学和人工智能几乎进入阳光下的每个行业,建立一个能够建立成功的AI项目的团队的挑战也是如此。对统计学家,程序员和沟通者完美融合的……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:107次

  • 数据治理的方法论是什么?

    数据治理的方法论是什么?

    一套科学、完整的实施方法论,可以为用户建立一套适应用户业务需求,并且操作性强的主数据管理体系。遵循该方法路线进行数据治理工作可以大大缩减……查看详情

    发布时间:2019.06.14来源:欣思博述数字化浏览量:91次

  • 幸存下来的数据治理浪潮

    幸存下来的数据治理浪潮

    我们正在从大数据的狂野西部时期出现,当时的问题主要集中在技术上是否可行,而不是合法或道德。文化需要一段时间才能改变,工具的发展也需要时间……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:93次

  • 十年经验总结:企业物料主数据建设方案

    十年经验总结:企业物料主数据建设方案

    目前很多企业已建立ERP系统,关联到整个企业运营的物料数据仍然存在“一物多码”、“描述不规范”等数据质量问题,这会对企业数据流通共享和经……查看详情

    发布时间:2021.05.21来源:亿信数据治理知识库浏览量:279次

  • 数据治理委员会:指导原则

    数据治理委员会:指导原则

    数据所有权 指定义与特定数据集相关的各种责任级别。讨论谁负责特定的数据任务已经使我们机构的数据维护和准确性变得更加简单。……查看详情

    发布时间:2018.11.23来源:数据治理浏览量:93次

  • 构建业务术语表可以增强数据治理

    构建业务术语表可以增强数据治理

    专家表示,数据专业人员负责在整个组织内建立一个通用词汇表,以帮助确保数据治理成功和遵守GDPR。……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:137次

  • 如何有效的进行数据治理和数据管控

    如何有效的进行数据治理和数据管控

    大数据时代的到来,让政府、企业看到了数据资产的价值,并快速开始探索应用场景和商业模式、建设技术平台。但是,如果在大数据拼图中遗忘了数据治……查看详情

    发布时间:2019.01.03来源:数据改变生活浏览量:105次

  • 数据治理寻求未来:平衡数据治理和数据管理

    数据治理寻求未来:平衡数据治理和数据管理

    想要通过快速访问高质量数据,灌输信心并支持数据驱动的决策,为业务合作伙伴创造竞争优势吗?那么这篇文章你一定得看!……查看详情

    发布时间:2019.08.29来源:知乎浏览量:64次

  • 数据共享交换平台解决方案

    数据共享交换平台解决方案

    数据交换平台是业务系统间无缝共享数据、连通信息孤岛的高速公路,由数据交换管理模块、核心元数据审批模块、适配器模块、数据传输设计模块,权限……查看详情

    发布时间:2020.04.23来源:知乎浏览量:96次

  • 数据治理超越了将事实放在一起

    数据治理超越了将事实放在一起

    学习如何学习正成为一项关键的执行技能,学习概率思维将成为赌注。……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:75次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议