数据湖中的数据管理与治理

发布时间:2019.03.05来源:亿信华辰浏览量:107次标签:数据治理


数据湖是存储所有数据的中心位置,无论源或格式如何。它通常使用Hadoop构建。数据可以是结构化的或非结构化的。您可以使用各种存储,分析和处理工具快速提取价值,以便为关键的组织决策提供信息。

由于欢迎所有数据,因此数据湖是传统企业数据仓库的有力替代或补充。此外,随着组织转向基于云的应用程序和物联网,数据湖是一个主要选择。

在早期用例中,组织经常将数据加载到数据湖中而不尝试对其进行管理。随着数据湖泊的成熟并对组织变得更具战略性,将数据转储到数据湖中并希望获得最佳效果已经不够了。

数据湖具有灵活性,可扩展性和成本效益。但是,如果您添加数据管理和治理功能(如数据质量,元数据管理,安全性,转换以及分组或组合数据的能力),它还可以拥有传统EDW的大部分内容。如果管理得当,数据湖可以改进现有的数据计划并实现新的计划。您的组织可以在构建数据湖时选择以下四种路径之一:

选项1:稍后解决治理问题

第一种选择是忽略治理并将数据自由加载到湖中。之后,当您需要从数据中发现见解时,您将不得不找到清理数据的工具,例如机器学习技术。这种方法存在实际风险。即便是最智能的推理引擎也需要在湖中的大量数据中启动。不可避免地,数据湖的某些部分将被忽略,变得停滞,孤立,并包含结构如此之少的数据,即使是最聪明的自动化工具 - 或人类分析师 - 也不知道从哪里开始。

选项2:调整现有的传统工具

您可以利用最初为EDW设计的应用程序和流程。可以使用软件工具执行在EDW中导入干净数据时使用的ETL过程。您可以使用这些工具将数据导入湖中,但这样做成本很高,并且只能解决您需要的部分管理和治理功能。另一个缺点是ETL发生在Hadoop集群之外,减慢了操作并增加了成本,因为每个查询都必须将数据移出集群。

选项3:编写自定义脚本

使用第三个选项,您可以使用自定义脚本构建工作流,该脚本连接流程,应用程序,质量检查和数据转换以满足治理需求。这是一个受欢迎的选择,但是最不可靠和最耗费资源。您需要熟练掌握Hadoop及其生态系统的高技能分析师来利用开源工具,他们需要编写脚本来连接各个部分。随着您在湖中成长,这个过程变得更加耗时且成本更高,因为您必须不断修改复杂的代码和工作流程。

选项4:部署集成数据湖管理平台

第四种选择是整合数据湖泊管理平台,该平台专门用于摄取和管理数据湖中的大量不同数据集。Zaloni的Bedrock提供此功能。它允许您对数据进行编目,利用元数据,并支持确保数据质量,数据沿袭和自动化工作流程的持续过程。这种方法正在成为数据湖管理和治理的最佳解决方案。

当您转换到数据湖时,选择完全集成的数据湖泊管理平台将使您对数据充满信心,并对其进行扩展以包含越来越多的用户和有利于业务的用例。毕竟,这就是数据的用途,通知和改善整个组织的决策流程,并以新的和令人兴奋的方式帮助您的业务增长。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据管理自动化框架的五个好处

    数据管理自动化框架的五个好处

    组织负责管理比以往任何时候都多的数据,使一个强大的自动化框架成为必要。但是自动化框架到底是什么,它又有什么关系呢?……查看详情

    发布时间:2019.02.13来源:亿信华辰浏览量:92次

  • 数据治理在有效合规计划中的作用

    数据治理在有效合规计划中的作用

    有效的合规计划由许多活动部分组成。关键数据来自运行操作所需的各种工具,文档,系统和技术。因此,企业在试图获得任何特定时间的风险状况的完整……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:52次

  • 技术最热门的新趋势:数据治理

    技术最热门的新趋势:数据治理

    什么是信息技术最热门的新趋势?如果你说“人工智能”,给自己部分功劳,因为AI肯定很热。但对于商业领域的技术决策者来说,有一些更大的问题就……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:59次

  • 大数据治理平台建设过程

    大数据治理平台建设过程

    分为三个层次,分别为战略与治理保障、大数据管理和大数据应用与服务,其中战略与治理保障包括,数据战略规划与评估,数据治理组织与职责、数据制……查看详情

    发布时间:2019.08.19来源:CSDN浏览量:221次

  • 云端世界数据治理的12步指南

    云端世界数据治理的12步指南

    数据治理是任何大数据战略的关键组成部分。随着公司越来越多地转向数据来影响他们的决策,数据所有者必须了解跨越应用程序,内部部署设施和云的数……查看详情

    发布时间:2018.11.19来源:Joey Jablonski浏览量:66次

  • 正确的数据文化是数据治理成功的预测指标

    正确的数据文化是数据治理成功的预测指标

    获得数据治理计划的业务和领导支持 - 以及在该支持下建立数据文化 - 仍然是许多组织面临的重大挑战。然而,根据一项新的调查,获得这种支持……查看详情

    发布时间:2019.02.25来源:亿信华辰浏览量:84次

  • 大数据治理——元数据是关键

    大数据治理——元数据是关键

    在大数据时代,当数据以多种格式分散在整个企业中并来自许多来源时,需要一种新的数据治理方法。……查看详情

    发布时间:2018.12.03来源:数据管理浏览量:60次

  • 创新基础:智能数据治理是一项团队运动

    创新基础:智能数据治理是一项团队运动

    对于任何希望创新其战略以提高运营效率,提高质量,优化人口健康管理或推动精准医疗的卫生系统而言,数据治理是必不可少的必备措施之一。……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:79次

  • 如何确定数据治理工具与数据中心及信息系统的关系

    如何确定数据治理工具与数据中心及信息系统的关系

    通过实施数据治理工具,可以让数据质量变得更好,发掘数据资产的商业价值,实现如下目标:对业务的支撑;降低经营风险、安全保障;对决策进行支持……查看详情

    发布时间:2021.04.30来源:亿信数据治理知识库浏览量:90次

  • 数据沿袭工具如何促进数据治理策略

    数据沿袭工具如何促进数据治理策略

    企业可以通过跟踪数据更改的方式和时间来加强数据治理工作。专家David Loshin就如何使用数据沿袭产品提供建议。……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:80次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议