大数据时代地方政府大数据治理战略

发布时间:2019.08.15来源:浏览量:121次标签:数据治理

全球各地的组织正在投资于能够以先前无法想象的方式容纳和处理数据的系统。在某些情况下,企业甚至会根据这些新系统重新构建现有的IT环境。这些大数据系统产生了切实的成果:增加收入和降低成本。然而,积极的结果远未得到保证。要真正从一个人的数据中获取价值,必须对这些新平台进行管理。
数据治理
数据治理一词在许多数据从业者的心中引起了恐惧。由于它经常被模糊地定义和误解,许多人只是转而采用仅限技术的方法来解决他们的治理需求。许多大数据系统带来的复杂性使得这种基于技术的方法特别具有吸引力,尽管众所周知,单靠技术很少就足够了。可能鲜为人知的是,在优化数据治理时,必须重新审视技术本身。

定义数据治理

在我们定义数据治理之前,或许了解哪些数据治理不是很有用。
数据治理不是数据沿袭,管理或主数据管理。这些术语中的每一个通常都与数据治理相结合,甚至代替数据治理。实际上,这些实践是某些组织的数据治理计划的组成部分。它们是重要的组件,但它们仅仅是组件。

数据治理的核心是正式管理整个企业的重要数据,从而确保从中获取价值。虽然成熟度水平因组织而异,但数据治理通常通过人员和流程的组合来实现,其中技术用于简化和自动化流程的各个方面。

以安全为例。即使是基本的治理级别,也需要保护企业的重要敏感数据资产。进程必须防止未经授权访问敏感数据,并将这些数据的全部或部分内容暴露给具有合法“需要知道”的用户。人们必须帮助确定谁应该或不应该访问某些类型的数据。身份管理系统和权限管理功能等技术可简化和自动化这些任务的关键方面。一些数据平台通过绑定到现有的基于用户名/密码的注册表(来进一步简化杂务,并且在分配权限时允许更大的表现力,超出POSIX模式位提供的相对较少的自由度。

我们还应该认识到,随着数据的速度和数量的增加,人类几乎不可能及时对这些数据进行分类。组织有时被迫将新数据锁定在保留单元中,直到有人对其进行适当分类并将其暴露给最终用户。有价值的时间丢失了。幸运的是,技术提供商正在开发创新方法来自动对数据进行分类,无论是直接采集还是之后不久。通过利用这些技术,满足授权过程的关键先决条件,同时最大限度地缩短洞察时间。

大数据时代的数据治理有何不同?
到目前为止,我们大多数人都熟悉大数据的三个特性:
数量:大数据系统中的数据量可达到数PB甚至更多。

多样性:数据不再只是简单的关系格式; 它可以是结构化的,半结构化的,甚至是非结构化的; 数据存储库跨文件,NoSQL表和流。

速度:数据需要从全球各地的设备中快速摄取,包括物联网来源。必须实时分析数据。

管理这些系统可能很复杂。组织通常被迫将单独的集群拼接在一起,每个集群都有自己的业务目的,或者存储和处理独特的数据类型,如文件,表或流。即使仔细地完成拼接本身,也会快速暴露间隙,因为在多个存储库中一致地保护数据集可能极易出错。


融合架构极大地简化了治理。在融合系统中,几种数据类型被集成到单个数据存储库中,可以一次性管理和保护。本身没有拼接,因为整个系统都是从同一块布上剪下来的。

除了三个V之外,还有另一个更微妙的区别。大多数大数据分布包括不同分析和机器学习引擎的合并,这些引擎位于数据存储“顶部”。这种灵活性对最终用户来说非常有用,因为他们可以选择最适合其特定分析需求的工具。从治理的角度来看,问题在于这些工具并不总是遵循相同的安全机制或协议,也不能完全,一致地记录操作,也不能在可扩展的存储库中记录,至少不是开箱即用。

因此,大数据从业者在试图满足合规性或审计师对数据沿袭的要求时可能会陷入困境,数据沿袭旨在回答问题的治理组成部分“这些数据来自何处以及发生了什么随着时间推移呢?“

基于流的数据沿袭体系结构
幸运的是,可以使用更具规范性的方法以及与大数据需求成比例扩展的系统来解决数据沿袭问题。特别是,基于流的体系结构允许组织“发布”在集群内被摄取和转换的数据。然后,消费者可以“订阅”这些数据,并以任何必要的方式填充下游系统。

现在回答基本的血统问题是一件简单的事情,例如“为什么我的结果看起来不对?” 只需使用流来回放并重放事件序列以确定出错的地方。此外,管理员甚至可以从流中重放事件,以便在下游系统损坏或发生故障时重新创建。

这可以说是解决数据沿袭问题的一种更符合法规要求的方法,但必须满足某些条件。特别:

1.流必须是不可变的
2.为所有活动的发布者和订阅者设置权限
3.审计日志设置为记录谁消耗数据以及何时消耗数据
4.流允许全局复制,如果给定站点发生故障,则允许高可用性


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2021金融数据治理的趋势

    2021金融数据治理的趋势

    金融数据治理逐渐体现出了目标双核化、结果资产化、手段科技化的特点,并且具有了生态治理、标准治理、中台治理的数据治理趋势。……查看详情

    发布时间:2021.05.18来源:亿信数据治理知识库浏览量:156次

  • 7点数据治理实践方法

    7点数据治理实践方法

    Gartner定义了七项良好的数据治理运作的原则,通过遵循这些最佳实践准则并提出以下问题,您可以为成功的数据治理策略做好准备。……查看详情

    发布时间:2021.06.23来源:亿信数据治理知识库浏览量:148次

  • 大数据治理需要解决哪些问题?

    大数据治理需要解决哪些问题?

    随着云时代的来临,大数据也吸引了越来越多的关注。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大……查看详情

    发布时间:2018.10.15来源:数邦客浏览量:148次

  • 2021金融数据治理案例分享

    2021金融数据治理案例分享

    2021年,分析机构BARC在一项研究中对全球378家公司进行了调查,96%的受访企业认为,数据治理已经不可或缺,而且未来将继续在企业中……查看详情

    发布时间:2021.04.09来源:数据治理研究院浏览量:259次

  • 数据治理——银行将被如何规范?

    数据治理——银行将被如何规范?

    我们认为,此番对数据治理的指引,未来可能会被其他金融监管机构作为范本,约束互联网金融或其他业态的数据治理行为,因此,具有学习和研究价值。……查看详情

    发布时间:2019.01.18来源:亿信华辰浏览量:143次

  • 为什么集成和治理对数据湖成功至关重要

    为什么集成和治理对数据湖成功至关重要

    这是一个由三部分组成的系列文章的最后一篇文章,探讨如何构建一个能够满足真正企业级数据管理平台所有要求的数据湖。虽然早期的专题文章侧重于H……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:117次

  • 企业数据交换共享平台整体解决方案

    企业数据交换共享平台整体解决方案

    以一个场景来说。某个企业想要筹建数据中心,用于将各业务系统数据接入,标准化处理后将数据公布给分析系统展示。项目周期比较短,那是否有现成的……查看详情

    发布时间:2020.04.23来源:知乎浏览量:195次

  • 谈大数据时代下的数据治理

    谈大数据时代下的数据治理

    2013年被众多的IT人定义为中国的大数据元年,这一年国内的大数据项目开始在交通、电信、金融部门被广泛推动。各大银行对Hadoop的规划……查看详情

    发布时间:2019.01.03来源:亿信华辰浏览量:122次

  • 企业数据标准管理价值总结

    企业数据标准管理价值总结

    一个数据一般有业务属性、技术属性和管理属性组成,例如:数据项的业务定义、业务规则、质量规则为该数据的业务属性;数据项的名称、编码、类型、……查看详情

    发布时间:2020.09.18来源:知乎浏览量:134次

  • 企业架构组织的创新能力如何?

    企业架构组织的创新能力如何?

    回想一下最新的企业架构文章,博客文章,甚至是你读过的职位描述,并算一下至少一次没有提到“创新”的内容?我猜测,“创新”往往被作为有效企业……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:155次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议