大数据时代地方政府大数据治理战略
发布时间:2019.08.15来源:浏览量:81次标签:数据治理
数据治理一词在许多数据从业者的心中引起了恐惧。由于它经常被模糊地定义和误解,许多人只是转而采用仅限技术的方法来解决他们的治理需求。许多大数据系统带来的复杂性使得这种基于技术的方法特别具有吸引力,尽管众所周知,单靠技术很少就足够了。可能鲜为人知的是,在优化数据治理时,必须重新审视技术本身。
定义数据治理
在我们定义数据治理之前,或许了解哪些数据治理不是很有用。
数据治理不是数据沿袭,管理或主数据管理。这些术语中的每一个通常都与数据治理相结合,甚至代替数据治理。实际上,这些实践是某些组织的数据治理计划的组成部分。它们是重要的组件,但它们仅仅是组件。
数据治理的核心是正式管理整个企业的重要数据,从而确保从中获取价值。虽然成熟度水平因组织而异,但数据治理通常通过人员和流程的组合来实现,其中技术用于简化和自动化流程的各个方面。
以安全为例。即使是基本的治理级别,也需要保护企业的重要敏感数据资产。进程必须防止未经授权访问敏感数据,并将这些数据的全部或部分内容暴露给具有合法“需要知道”的用户。人们必须帮助确定谁应该或不应该访问某些类型的数据。身份管理系统和权限管理功能等技术可简化和自动化这些任务的关键方面。一些数据平台通过绑定到现有的基于用户名/密码的注册表(来进一步简化杂务,并且在分配权限时允许更大的表现力,超出POSIX模式位提供的相对较少的自由度。
我们还应该认识到,随着数据的速度和数量的增加,人类几乎不可能及时对这些数据进行分类。组织有时被迫将新数据锁定在保留单元中,直到有人对其进行适当分类并将其暴露给最终用户。有价值的时间丢失了。幸运的是,技术提供商正在开发创新方法来自动对数据进行分类,无论是直接采集还是之后不久。通过利用这些技术,满足授权过程的关键先决条件,同时最大限度地缩短洞察时间。
大数据时代的数据治理有何不同?
到目前为止,我们大多数人都熟悉大数据的三个特性:
数量:大数据系统中的数据量可达到数PB甚至更多。
多样性:数据不再只是简单的关系格式; 它可以是结构化的,半结构化的,甚至是非结构化的; 数据存储库跨文件,NoSQL表和流。
速度:数据需要从全球各地的设备中快速摄取,包括物联网来源。必须实时分析数据。
管理这些系统可能很复杂。组织通常被迫将单独的集群拼接在一起,每个集群都有自己的业务目的,或者存储和处理独特的数据类型,如文件,表或流。即使仔细地完成拼接本身,也会快速暴露间隙,因为在多个存储库中一致地保护数据集可能极易出错。
除了三个V之外,还有另一个更微妙的区别。大多数大数据分布包括不同分析和机器学习引擎的合并,这些引擎位于数据存储“顶部”。这种灵活性对最终用户来说非常有用,因为他们可以选择最适合其特定分析需求的工具。从治理的角度来看,问题在于这些工具并不总是遵循相同的安全机制或协议,也不能完全,一致地记录操作,也不能在可扩展的存储库中记录,至少不是开箱即用。
因此,大数据从业者在试图满足合规性或审计师对数据沿袭的要求时可能会陷入困境,数据沿袭旨在回答问题的治理组成部分“这些数据来自何处以及发生了什么随着时间推移呢?“
基于流的数据沿袭体系结构
幸运的是,可以使用更具规范性的方法以及与大数据需求成比例扩展的系统来解决数据沿袭问题。特别是,基于流的体系结构允许组织“发布”在集群内被摄取和转换的数据。然后,消费者可以“订阅”这些数据,并以任何必要的方式填充下游系统。
现在回答基本的血统问题是一件简单的事情,例如“为什么我的结果看起来不对?” 只需使用流来回放并重放事件序列以确定出错的地方。此外,管理员甚至可以从流中重放事件,以便在下游系统损坏或发生故障时重新创建。
这可以说是解决数据沿袭问题的一种更符合法规要求的方法,但必须满足某些条件。特别:
1.流必须是不可变的
2.为所有活动的发布者和订阅者设置权限
3.审计日志设置为记录谁消耗数据以及何时消耗数据
4.流允许全局复制,如果给定站点发生故障,则允许高可用性
-
如何实现数据治理合作交流的4点建议
数据如同工业的石油一样,成为国家的重要资源,成为推动经济社会增长和发展的重要引擎。大数据、云计算、人工智能是大势所趋,发展这些技术也是人……查看详情发布时间:2019.10.25来源:知乎浏览量:74次
-
灵活的分析数据生命周期?
受监管实验室数据完整性指南的要求之一是数据生命周期,涵盖监管记录的生死。数据生命周期在最近的MHRA数据完整性指南中定义为“从生成和记录……查看详情发布时间:2018.12.27来源:数据治理浏览量:100次
-
企业数字化转型面临的挑战
来自调研机构Gartner的预测也显示,到2020年,多数企业将有75%的业务实现数字化或正在数字化。数字化转型已经成为企业发展的必经之……查看详情发布时间:2020.04.03来源:知乎浏览量:74次
-
您不应该进行数据治理的3个理由
今天有很多关于数据治理的讨论。但令人惊讶的是,今天“进行数据治理”的组织数量并不高。在我看来,数据治理是现代数据驱动型企业的必备条件。但……查看详情发布时间:2018.12.13来源:数据治理浏览量:89次
-
数据治理—构建你的数据屏障
在快速发展的技术,大数据和高级分析的时代,数据治理在每个组织中都发挥着至关重要的作用,无论规模大小或行业如何。从定义元数据管理指南,到解……查看详情发布时间:2019.06.28来源:知乎浏览量:90次
-
可以加强您的数据治理框架的五大方面
信息就是力量,您的组织每天都依靠它来做出明智的商业决策。不幸的是,组织产生的数据并没有按照应有的方式进行管理。大数据调查表明,业务和技术……查看详情发布时间:2019.07.04来源:知乎浏览量:99次
-
DAMA 数据管理知识体系指南-数据管理方方面面的一部代表性著作
本书由DAMA International组织众多数据管理领域的国际级资深专家编著。这是一项里程碑式的工作。数据管理是把业务和信息技术融……查看详情发布时间:2018.11.29来源:DAMA浏览量:128次
-
健康的共同依赖:数据管理和数据治理
现在,数据管理和数据治理比以往任何时候都更加重要。数据驱动业务的超竞争特性意味着组织需要比以往更多地从数据中获得更多 - 而且速度更快。……查看详情发布时间:2019.02.15来源:亿信华辰浏览量:101次