大数据治理的新范例

发布时间:2018.12.26来源:亿信华辰浏览量:136次标签:数据治理


数十年来,数据科学家已经拥有沙箱来探索数据并找到有价值的见解。在看似愉快的折衷方案中,分析师可以快速加载,操纵和组合企业和行业数据,以寻找新的见解和预测,而无需担心它们会危及敏感数据或生产工作流程。虽然这加速了创造新的见解,但将它们投入生产是一场噩梦。在未部署的环境中创建的一组自定义代码和数据需要在部署之前进行转换,质量控制和优化。企业通常需要一年的大部分时间才能从几周内收集的洞察中获得价值。 

大数据的幽灵有可能使情况变得更糟- 在很大程度上。现在,分析师们正在使用IT外部的数据结构和编程语言。外部数据源的数量和复杂性正在爆炸式增长。如果没有新的方法,在大数据沙箱中发现的洞察力可能永远不会投入生产。 

所出现的是一种新的范例,它将数据治理- 大多数分析师的诅咒这一术语 - 带入了大数据。但是,大数据治理不是严格限制数据使用和文档,而是灵活,协作和高效。它使分析师参与而非分离,以获取他们的学习以加速生产准备。最重要的是,它取代了沙箱数据的大规模转换,并采用“促销”流程,确保分析数据在大数据平台上生产就绪。 

大数据治理要求我们从头开始重新思考治理。大数据治理不是物理地分离沙箱和生产数据,而是逻辑地控制访问和使用,因为数据从“原始”到“准备”成熟。您如何判断数据是否已准备好生产?元数据。任何支持生产使用的大数据平台都必须具有跟踪数据摄取,验证,准备和使用生命周期的元数据。元数据需要管理数据访问权限,捕获数据分析结果以及数据开发人员和最终用户的评论。元数据存储定义生产准备的策略,并能够实施它们。没有元数据,数据湖就变成了数据沼泽。 

但为了实现这一点,元数据捕获必须是自动化和相关的。大数据治理的第二个原则与当前的教条相矛盾:从一开始就使用模式来丰富元数据。大多数业务数据都是结构化的,无论是关系数据库,日志文件,XML还是大型机副本。该结构可用于自动评估原始数据的质量,完整性和内容。这不仅为分析师提供了对数据的洞察力,还建立了一个可以构建的元数据基础。

大数据治理的第三个原则是记分卡驱动的优先级。并非所有数据都需要严格的质量和访问管理。实际上,假设大多数原始数据都不会被使用- 因此丰富其元数据是浪费时间。相反,记分卡是为数据的各种用途而创建的 - 合规报告,营销分析,供应链分析等。某些策略适用于所有记分卡 - 需要屏蔽PII数据 - 其他则非常具体 - 需要数据沿袭所有合规报告。使用元数据基础,可以轻松地为任何数据集创建记分卡。然后,这些记分卡用于识别治理工作并确定其优先级,以使最重要的数据生产就绪。 

从哪儿开始?如果您的数据库元数据较差,那么就建议您先评估现有资产的质量和内容。自动化工具可以填充元数据存储库,作为创建记分卡的基础。使湖泊的内容和质量透明是迈向大数据治理的第一步。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据资产如何安全可追溯,你们应该这样做!

    数据资产如何安全可追溯,你们应该这样做!

    近年来,食品安全中提到产地的可追溯性,给许多生鲜打上了专属的身份证以便出现问题可以追根溯源。而这并不稀奇,在使用报表工具时处于数据安全考……查看详情

    发布时间:2021.03.12来源:知乎浏览量:177次

  • 全球数据质量和数据治理解决方案市场

    全球数据质量和数据治理解决方案市场

    在企业数据管理生态系统中,数据质量是一个广义的术语,指的是数据和/或过程的质量,完整性和一致性等。数据质量还意味着数据准确性和一致性的程……查看详情

    发布时间:2019.07.11来源:知乎浏览量:136次

  • 业务流程建模与标准操作过程之间的联系

    业务流程建模与标准操作过程之间的联系

    我们上周开始了一个关于业务流程(BP)建模及其在企业中的角色的新博客系列。本周的重点是业务流程建模和标准操作过程之间的联系。具体而言,使……查看详情

    发布时间:2019.02.18来源:亿信华辰浏览量:147次

  • 数据治理和安全

    数据治理和安全

    从组织的角度来看,通过人力资源技术传递的数据需要尽可能保持清洁,一致和可转移。问题?多个系统,手动流程和其他低效率需要清理脏数据,稍后从……查看详情

    发布时间:2018.12.04来源:数据治理浏览量:228次

  • 金融行业数据治理与安全防护解决方案

    金融行业数据治理与安全防护解决方案

    在金融业各类涉及商业秘密和敏感数据的信息在处理、共享和使用过程中面临违规越权使用或被用于非法用途等数据泄漏的安全风险。一方面,数据处理过……查看详情

    发布时间:2019.09.30来源:CSDN浏览量:177次

  • 企业数据治理需要的能力

    企业数据治理需要的能力

    数据治理必然带来新的标准的确立和旧系统的改造,是一个有破有立、无破不立的过程。这一过程设计大量的跨部门、跨条线、跨系统的沟通协调,同时也……查看详情

    发布时间:2021.09.06来源:亿信华辰浏览量:180次

  • 企业如何进行数据资产管理

    企业如何进行数据资产管理

    大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发……查看详情

    发布时间:2020.08.28来源:知乎浏览量:121次

  • 通俗讲透什么是数据资产管理

    通俗讲透什么是数据资产管理

    作为一个初入数据治理这行的小白,刚听到数据资产管理的时候也是一脸懵,资产编目?数据生命周期?归档?概念有时候实在有些抽象,再加上数据本来……查看详情

    发布时间:2020.08.14来源:知乎浏览量:160次

  • 为何数据治理如此重要?

    为何数据治理如此重要?

    如我们所见,数据正在以前所未有的速度增长,IDC曾发布报告称,到2025年,全球数据圈预计将增长至175 ZB。如何在这样一个数据大爆发……查看详情

    发布时间:2020.04.09来源:知乎浏览量:159次

  • 探索数据生命周期管理的五个阶段

    探索数据生命周期管理的五个阶段

    企业并不总是需要所有数据 - 特别是当数据被认为过时时。但是,诉讼,审计或其他突发事件可以使其快速检索变得至关重要。考虑到这种可能性,许……查看详情

    发布时间:2018.12.21来源:数据治理浏览量:133次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议