互联网企业数据治理决策要这么建
发布时间:2019.08.19来源:CSDN浏览量:83次标签:数据治理
本文为互联网企业提出了数据治理策略,为了保证数据的有效管理和使用,企业需要制定并执行数据治理策略。笔者调查了部分互联网企业的实践案例并查阅了治理框架和文献,本文通过展示如何执行已识别的策略,向实践者提供了一些想法和考虑。
一背景
2018年,Facebook Cambridge Analytica 丑闻被公开披露,许多新闻报道称这一事件严重影响了Facebook的股价和声誉。2008年也发现了类似的案例,一个研究项目组从Facebook上收集了1700个用户资料,然后公开了这些数据。2006年发生了一起美国在线的案例,美国在线向公众公布了用户的搜索日志数据,这些数据在披露后不久就被确认为个人身份信息(PII)数据,美国在线没有公开任何PII数据,然而,由于日志数据是由用户分类的,并且提供了大量的个人信息,因此很容易将其转换为PII数据。这3起事件都是因为数据治理出现了问题,比如数据的未经授权使用和数据使用中控制机制的缺失。
目前,互联网企业的数据治理尚不成熟,缺乏对谁拥有或使用非用户内容(如日志或关键字)的明确定义,数据的使用方式、时间和使用者都不清楚。这是互联网企业数据治理的一个关键性挑战,为了平台所有者和用户之间的信任以及业务的成功,这一问题应该得到解决。现有行业治理策略和学术著作的分析大多数是针对传统企业的,而互联网企业的数据治理仍处于相对萌芽的阶段。
二策略制定的关键原则
数据治理必须找到对以下两个问题的答案:需要做出哪些策略?哪些角色以及这些角色应该如何参与策制定过程?
本文集中于第一个问题即需要做出哪些策略,以确定关键的数据治理领域,数据治理策略通常建立在基本原则之上,这些基本原则为所有策略提供了一套指导方针和考虑因素。
2.1与企业战略保持一致
业务目标影响数据治理的方向和设计,数据治理目标应与业务目标和更高级别的治理目标保持一致,以最大化互联网企业的价值。如果一个互联网企业宗旨在提高用户满意度,它需要严格的控制机制来提高数据质量。
角色、收入共享、信任和控制是平台治理的关键职能。数据治理中的角色指的是一种责任明确的数据所有权形式,它允许互联网企业保护数据和数据所有者/使用者的权利。收入共享要求平台所有者应该考虑对数据贡献者的奖励。信任被认为是成功的先决条件,为了提高信任,数据使用的高透明度在数据治理中至关重要,可以通过与平台用户共享决定权来增加信任。否则,必须由平台所有者实施严格的控制机制,并且决策的结果或过程必须向所有用户开放。
2.2考虑所有参与者
在传统的数据治理中,数据管理有简单明确的角色,如创建存储、更新、归档和删除,而互联网企业的数据治理则需要处理多个方面之间复杂的关系。
互联网企业的参与者由平台所有者(包括平台发起人、协调人和提供者的角色)和平台用户(供应侧和需求侧用户)组成,所有参与者在互联网企业的数据治理中都扮演着关键的角色。因此,治理政策应同样适用于所有当事人,以便对每个人都适用,每一个用户都应该得到同样的机会和可获得性,因为它会带来更多的参与和想法,最终会带来新的创新。
这一原则使互联网企业能够开发出现实的数据治理策略,该策略应传递给所有用户。如果一个互联网企业需要更多的参与和信任,平台所有者可以给用户更多的机会以某种方式加入决策过程,帮助互联网企业从各方的角度设计和实现数据治理。
2.3覆盖所有类型的数据
互联网平台数据是从各种来源收集的,比如人或系统。互联网企业通常关注用户内容,在数据治理的策略过程中,其他类型的数据常常被忽略,由此可能导致不明确和不完整的治理策略。
互联网企业通常关注隐私法来保护个人身份信息(PII)数据,而PII和非PII并不是不可变的,非PII数据可以通过组合额外信息(如美国在线数据泄漏案件)成为PII数据。因此,必须强调非用户内容对于安全平台的重要性。除此之外,非用户内容的价值因为广告而增加,而广告是大多数互联网企业的主要收入来源。非用户内容如服务使用信息(如日志)被互联网企业用于定向广告,有针对性的广告机制显示了这些数据是如何通过无形和隐藏的市场使用的。
我们越来越担心数据滥用和侵犯隐私的道德问题,为了降低风险,互联网企业的数据治理应该考虑如何为互联网企业中的所有类型的数据建立可见的供应链。
2.4考虑不同的条件和环境
一个尺码的鞋子,不可能适合所有人的脚,否则就会出现削足适履的笑话。企业必须考虑自身不同的业务策略、目标和市场监管要求。该原则提供了这样一种思想,即可以基于平台的背景灵活的制定数据治理策略。
例如,苹果公司和Facebook在控制机制上明确显示了不同的治理策略。苹果的目标是提供高质量的服务,因此它通过人工审核进行严格控制。相比之下,Facebook则不受任何限制地允许用户输入任何内容,因而控制松散。治理策略常常导致严重后果,facebook分析丑闻就是一个例子,因为Facebook允许应用程序收集用户数据(甚至朋友的数据)以获得更高的市场份额和收入,数据误用或滥用和侵犯隐私的风险增加很多。与此相反,苹果公司的政策不允许应用程序收集用户数据,并限制使用用户数据的广告。
三数据治理关键领域
图1 数据治理关键领域及关系
3.1监管环境
这个领域的策略是“应该考虑哪些法规、特定的政策、标准和指导方针?”和“监管环境如何影响数据的使用?”
对于第一个策略,必须确定外部法律要求和内部政策以及合同协定。例如互联网企业处理个人信息,如姓名或地址时,应该考虑“2017年6月1日起施行的《中华人民共和国网络安全法》”来确定法律要求。
必须确定外部/内部合规要求,制定合规目标并对其进行审核。数据的使用应在法律允许的情况下予以确认,特别是当数据被取出并可能传播以供二次使用时,必须检查数据是否满足开放策略要求。所有这些流程必须由第三方进行审计,以避免偏见或利益冲突,并保持互联网企业的透明度。
3.2数据所有权和访问定义
这个领域指的是“谁拥有和使用互联网企业中的数据?”,一直是平台设计的核心概念。这些策略使互联网企业能够明确所有相关用户的角色、责任和对数据的全部权利。
所有类型数据的数据所有权和访问权都需要被明确的定义和执行,为了支持实施并保持执行结果的完整性和一致性,有必要与其他领域协作。应使用在数据用例域中定义的所有数据类型的数据分类。数据所有权和访问定义的清晰性得到了提高。必须使用监管环境领域中确定的相关法规来开发数据所有权/访问权的策略模型。如前所述,该决定应根据相关法规、法律或法院案件做出。
定义清晰的访问权限有助于提高平台的透明度,利益相关者应采用某种方法提供适当的信息和安全。然而,数据贡献者对数据的可访问性可能受到互联网企业策略或背景的限制。出于安全原因,平台禁止用户访问最后一个密码。治理策略者需要为互联网企业中的每一种数据类型考虑这种特定的背景。笔者建议一个贡献、拥有和访问(COA)矩阵来支持和简化这种复杂的情况。它允许用户清楚地了解哪些数据可以拥有/访问(或不可以访问)的定义,并正确地使用数据的合法权限。
表1 COA矩阵的使用示例
3.3数据用例
对于互联网企业来说,如何利用数据是赢得市场的关键。因此,有一系列的问题,如“收集了哪些类型的数据以及数据对业务的用途是什么?”及“如何在不失去控制的情况下使用数据?”应该在这个领域解决。
为了支持策略,定义数据分类可以很好地理解不同类型的数据,因为互联网企业从各种来源收集数据。大多数数据来自用户上传的内容,如视频、图像或用户信息(人为数据)。当用户使用平台服务时,平台系统会留下日志、搜索关键字或位置(机器生成的数据)等数据,这种类型的数据通常称为服务使用信息。数据也可以通过系统流程和事务,引用表或交互收集。应该考虑所有类型的数据,并将其包含在数据分类中。
举个例子,我们通过分析策略来确定Facebook的数据分类的三个层次。第一个层次包括用户资料(来自人)和服务使用信息(来自机器和流程),第二个层次分为8类(分别为6类和2类),最后一层的数据分类包括70多种类型的数据。
表2 Facebook数据分类
此外,企业需要根据业务目标决定收集数据的适当数据用例,用例必须包含可以使用的数据类型的信息,帮助平台检测和防止数据供应链中未经授权的数据使用。数据使用的监控应该基于已定义的用例信息来实现,以供可见和可靠的数据使用。数据来源允许平台保留关于数据的所有活动,识别所有相关的涉众,并防止拒绝数据操纵,当存在多个所有权问题时,可以使用它准确地度量数据提供者的贡献。
3.4贡献测量
互联网企业的成功与否取决于参与者的贡献,因此,收益共享是互联网企业的关键治理理念之一。许多研究指出,互联网企业应该考虑诸如“数据的业务价值是什么?”和“数据所有者的贡献需要什么奖励?”等问题,鼓励用户的贡献,分享互联网企业成长的收益。
每一个参与团队都希望得到即时的回报或未来的利益,第一步是确定与业务成功相关的贡献度量模型的具体参数。根据互联网企业的业务类型,参数可以是多种多样的。Facebook或YouTube等一些平台通常依赖广告,并通过用户内容增长,上传的内容对于吸引其他用户和达到临界质量起着重要作用。由于有针对性的广告,用户偏好、喜欢程度和关联群组也很有价值。同时,对于Uber等不同类型的商业平台来说,服务提供/购买的数量或数量是最重要的,因为该平台向用户收取服务费。
下一步,应该为用户确定合适的奖励类型。有3种主要类型的奖励可以被普遍认为是激励贡献者:曝光、补贴(例如以广告收入共享形式的直接现金转移、信用、实物、免费信息或技术支持)和声誉。
根据互联网企业的能力和背景,不同类型的奖励可以单独使用,也可以组合使用。补贴被认为是私募股权投资的重要启动策略之一。然而,对于谷歌等占主导地位的互联网企业来说,敞口可能是一个不错的选择,因为它的边际成本为零,但却为受益者提供了巨大的优势。下图显示了贡献度量管理的概念。
图2 贡献评估管理
确定奖励的受益者可以很简单,也可以很复杂。如果只有一个贡献者,那么贡献度量将非常简单。同时,使用派生数据(聚合或转换的数据)可能导致度量问题,因为数据可能包含复杂的所有权结构。数据来源管理(数据用例域)有助于解决这个问题,它允许平台识别所有相关的涉众,并通过保存数据使用的所有记录来准确地度量每个数据所有者的贡献。
总结
理论上重要的治理策略在现实世界中得到了解决,在互联网企业的数据治理中发现了四个策略(监管环境、数据所有权/访问权、数据用例和贡献度量)的实现。在此基础上,互联网企业可以根据自身情况灵活调整或改进数据治理策略。
-
数据治理:医院要平衡的4个考虑因素
电子健康倡议基金会,一个专注于质量和安全改进的医疗保健合作,以及LexisNexis Risk Solutions的医疗保健部门,于8月……查看详情发布时间:2018.11.27来源:Jessica Kim Cohen浏览量:70次
-
数据治理——银行将被如何规范?
我们认为,此番对数据治理的指引,未来可能会被其他金融监管机构作为范本,约束互联网金融或其他业态的数据治理行为,因此,具有学习和研究价值。……查看详情发布时间:2019.01.18来源:亿信华辰浏览量:106次
-
主数据管理的三个关键成功因素
随着主数据管理解决方案市场的不断成熟,越来越清楚的是,主数据管理的程序管理方面至少与所实施的技术解决方案同样重要,甚至更为重要。那么,主……查看详情发布时间:2021.05.28来源:亿信数据治理知识库浏览量:112次
-
数据管理自动化框架的五个好处
组织负责管理比以往任何时候都多的数据,使一个强大的自动化框架成为必要。但是自动化框架到底是什么,它又有什么关系呢?……查看详情发布时间:2019.02.13来源:亿信华辰浏览量:108次
-
当前数据治理存在哪些问题和困难?
数据治理不只是技术问题,更是一个管理问题。例如大家常见的项目管理系统只是一个工具,如何让项目管理工具与项目管理思想相匹配才是项目管理系统……查看详情发布时间:2020.04.09来源:知乎浏览量:109次
-
数据中台和传统的数据系统出发点不一样
原来的数据平台也好,数据湖也好,数据仓库也好,它们的出发点很多时候有局限性,应该说更是一个支撑性的技术系统,即一定要去考虑我先有什么数据……查看详情发布时间:2021.01.23来源:知乎浏览量:92次
-
数据治理的数据架构:主动方法
“数据架构是业务战略的物理实现,” 全球数据战略有限公司 EMEA首席顾问Nigel Turner在DATAVERSITY® 企业数据治……查看详情发布时间:2019.01.17来源:数据治理浏览量:100次
-
数据治理工具:组织,访问,保护的最佳工具
数字化转型极大地改变了我们开展业务的方式,这一点在数据治理方面更为明显。有效的数据治理工具对于确保数据的完整性至关重要,同时导航不断发展……查看详情发布时间:2019.01.21来源:亿信华辰浏览量:71次