大数据时代地方政府大数据治理战略

发布时间:2019.08.15来源:浏览量:103次标签:数据治理

全球各地的组织正在投资于能够以先前无法想象的方式容纳和处理数据的系统。在某些情况下,企业甚至会根据这些新系统重新构建现有的IT环境。这些大数据系统产生了切实的成果:增加收入和降低成本。然而,积极的结果远未得到保证。要真正从一个人的数据中获取价值,必须对这些新平台进行管理。
数据治理
数据治理一词在许多数据从业者的心中引起了恐惧。由于它经常被模糊地定义和误解,许多人只是转而采用仅限技术的方法来解决他们的治理需求。许多大数据系统带来的复杂性使得这种基于技术的方法特别具有吸引力,尽管众所周知,单靠技术很少就足够了。可能鲜为人知的是,在优化数据治理时,必须重新审视技术本身。

定义数据治理

在我们定义数据治理之前,或许了解哪些数据治理不是很有用。
数据治理不是数据沿袭,管理或主数据管理。这些术语中的每一个通常都与数据治理相结合,甚至代替数据治理。实际上,这些实践是某些组织的数据治理计划的组成部分。它们是重要的组件,但它们仅仅是组件。

数据治理的核心是正式管理整个企业的重要数据,从而确保从中获取价值。虽然成熟度水平因组织而异,但数据治理通常通过人员和流程的组合来实现,其中技术用于简化和自动化流程的各个方面。

以安全为例。即使是基本的治理级别,也需要保护企业的重要敏感数据资产。进程必须防止未经授权访问敏感数据,并将这些数据的全部或部分内容暴露给具有合法“需要知道”的用户。人们必须帮助确定谁应该或不应该访问某些类型的数据。身份管理系统和权限管理功能等技术可简化和自动化这些任务的关键方面。一些数据平台通过绑定到现有的基于用户名/密码的注册表(来进一步简化杂务,并且在分配权限时允许更大的表现力,超出POSIX模式位提供的相对较少的自由度。

我们还应该认识到,随着数据的速度和数量的增加,人类几乎不可能及时对这些数据进行分类。组织有时被迫将新数据锁定在保留单元中,直到有人对其进行适当分类并将其暴露给最终用户。有价值的时间丢失了。幸运的是,技术提供商正在开发创新方法来自动对数据进行分类,无论是直接采集还是之后不久。通过利用这些技术,满足授权过程的关键先决条件,同时最大限度地缩短洞察时间。

大数据时代的数据治理有何不同?
到目前为止,我们大多数人都熟悉大数据的三个特性:
数量:大数据系统中的数据量可达到数PB甚至更多。

多样性:数据不再只是简单的关系格式; 它可以是结构化的,半结构化的,甚至是非结构化的; 数据存储库跨文件,NoSQL表和流。

速度:数据需要从全球各地的设备中快速摄取,包括物联网来源。必须实时分析数据。

管理这些系统可能很复杂。组织通常被迫将单独的集群拼接在一起,每个集群都有自己的业务目的,或者存储和处理独特的数据类型,如文件,表或流。即使仔细地完成拼接本身,也会快速暴露间隙,因为在多个存储库中一致地保护数据集可能极易出错。


融合架构极大地简化了治理。在融合系统中,几种数据类型被集成到单个数据存储库中,可以一次性管理和保护。本身没有拼接,因为整个系统都是从同一块布上剪下来的。

除了三个V之外,还有另一个更微妙的区别。大多数大数据分布包括不同分析和机器学习引擎的合并,这些引擎位于数据存储“顶部”。这种灵活性对最终用户来说非常有用,因为他们可以选择最适合其特定分析需求的工具。从治理的角度来看,问题在于这些工具并不总是遵循相同的安全机制或协议,也不能完全,一致地记录操作,也不能在可扩展的存储库中记录,至少不是开箱即用。

因此,大数据从业者在试图满足合规性或审计师对数据沿袭的要求时可能会陷入困境,数据沿袭旨在回答问题的治理组成部分“这些数据来自何处以及发生了什么随着时间推移呢?“

基于流的数据沿袭体系结构
幸运的是,可以使用更具规范性的方法以及与大数据需求成比例扩展的系统来解决数据沿袭问题。特别是,基于流的体系结构允许组织“发布”在集群内被摄取和转换的数据。然后,消费者可以“订阅”这些数据,并以任何必要的方式填充下游系统。

现在回答基本的血统问题是一件简单的事情,例如“为什么我的结果看起来不对?” 只需使用流来回放并重放事件序列以确定出错的地方。此外,管理员甚至可以从流中重放事件,以便在下游系统损坏或发生故障时重新创建。

这可以说是解决数据沿袭问题的一种更符合法规要求的方法,但必须满足某些条件。特别:

1.流必须是不可变的
2.为所有活动的发布者和订阅者设置权限
3.审计日志设置为记录谁消耗数据以及何时消耗数据
4.流允许全局复制,如果给定站点发生故障,则允许高可用性


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理和当今的新数据目标

    数据治理和当今的新数据目标

    尽管实施全面的治理计划似乎令人生畏,但拥有有效数据治理策略和MDM解决方案的公司不断寻找新方法从数据中提取价值。……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:112次

  • 数据中台与数据仓库相比的四大优势

    数据中台与数据仓库相比的四大优势

    数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。因此,其重点在于数据的集合。数据仓库可使用维度建……查看详情

    发布时间:2020.11.21来源:知乎浏览量:124次

  • 数据治理与IT治理的区别

    数据治理与IT治理的区别

    最近,我们一直专注于数据治理,从数据中获取最大价值并防止下一次重大漏洞,我们中的许多人忽略了IT治理基础,这有助于我们实现卓越的数据治理……查看详情

    发布时间:2018.11.15来源:Cindy Ng浏览量:136次

  • 数据安全治理的基本思路

    数据安全治理的基本思路

    我们的世界正在进入一个奇怪的分裂状态:一方面人们为大数据时代即将在各个领域发生的革命性进步而激动难眠,另一方面人们也在为数据安全和隐私保……查看详情

    发布时间:2019.06.14来源:数据杂志浏览量:122次

  • 定义DG:数据治理可以为您做什么?

    定义DG:数据治理可以为您做什么?

    由于数据驱动的业务,数据治理(DG)变得越来越普遍,但是对于许多组织来说,定义DG并进行合理的实践仍然很困难。……查看详情

    发布时间:2019.01.21来源:亿信华辰浏览量:150次

  • 如何选择合适的企业数据治理工具

    如何选择合适的企业数据治理工具

    清楚了在数据治理工具选择中的应注意的6大问题,才能在着手选择企业数据治理工具之前就可以清楚地知道要如何去做筛选。……查看详情

    发布时间:2021.03.31来源:数据治理研究院浏览量:100次

  • 每天12亿条交通大数据如何为城市建设提供参考

    每天12亿条交通大数据如何为城市建设提供参考

    明天天气怎么样?要回答这个问题,人们会立刻查看天气预报。 那明天的路况呢?交通大数据能告诉你。 ……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:92次

  • 数据质量六大评价标准是什么

    数据质量六大评价标准是什么

    随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖……查看详情

    发布时间:2022.03.28来源:小亿浏览量:6093次

  • 避免这五大数据治​​理错误

    避免这五大数据治​​理错误

    如果您正在开始一个大数据项目,那么您可能会遇到一个或多个数据管理挑战。您就如何实施数据治理以及如何控制数据流所做出的决策可能会影响您的项……查看详情

    发布时间:2019.02.27来源:亿信华辰浏览量:115次

  • 业务词汇表和元数据:数据治理和词汇表准备

    业务词汇表和元数据:数据治理和词汇表准备

    我经常被问到“我们如何捕获数据词汇表资产”和“我们是否已准备好与数据管理员合作?”我的回答始终是:如果您能说明数据治理计划的目标并拥有赞……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:124次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议