大数据治理的新范例

发布时间:2018.12.26来源:亿信华辰浏览量:167次标签:数据治理


数十年来,数据科学家已经拥有沙箱来探索数据并找到有价值的见解。在看似愉快的折衷方案中,分析师可以快速加载,操纵和组合企业和行业数据,以寻找新的见解和预测,而无需担心它们会危及敏感数据或生产工作流程。虽然这加速了创造新的见解,但将它们投入生产是一场噩梦。在未部署的环境中创建的一组自定义代码和数据需要在部署之前进行转换,质量控制和优化。企业通常需要一年的大部分时间才能从几周内收集的洞察中获得价值。 

大数据的幽灵有可能使情况变得更糟- 在很大程度上。现在,分析师们正在使用IT外部的数据结构和编程语言。外部数据源的数量和复杂性正在爆炸式增长。如果没有新的方法,在大数据沙箱中发现的洞察力可能永远不会投入生产。 

所出现的是一种新的范例,它将数据治理- 大多数分析师的诅咒这一术语 - 带入了大数据。但是,大数据治理不是严格限制数据使用和文档,而是灵活,协作和高效。它使分析师参与而非分离,以获取他们的学习以加速生产准备。最重要的是,它取代了沙箱数据的大规模转换,并采用“促销”流程,确保分析数据在大数据平台上生产就绪。 

大数据治理要求我们从头开始重新思考治理。大数据治理不是物理地分离沙箱和生产数据,而是逻辑地控制访问和使用,因为数据从“原始”到“准备”成熟。您如何判断数据是否已准备好生产?元数据。任何支持生产使用的大数据平台都必须具有跟踪数据摄取,验证,准备和使用生命周期的元数据。元数据需要管理数据访问权限,捕获数据分析结果以及数据开发人员和最终用户的评论。元数据存储定义生产准备的策略,并能够实施它们。没有元数据,数据湖就变成了数据沼泽。 

但为了实现这一点,元数据捕获必须是自动化和相关的。大数据治理的第二个原则与当前的教条相矛盾:从一开始就使用模式来丰富元数据。大多数业务数据都是结构化的,无论是关系数据库,日志文件,XML还是大型机副本。该结构可用于自动评估原始数据的质量,完整性和内容。这不仅为分析师提供了对数据的洞察力,还建立了一个可以构建的元数据基础。

大数据治理的第三个原则是记分卡驱动的优先级。并非所有数据都需要严格的质量和访问管理。实际上,假设大多数原始数据都不会被使用- 因此丰富其元数据是浪费时间。相反,记分卡是为数据的各种用途而创建的 - 合规报告,营销分析,供应链分析等。某些策略适用于所有记分卡 - 需要屏蔽PII数据 - 其他则非常具体 - 需要数据沿袭所有合规报告。使用元数据基础,可以轻松地为任何数据集创建记分卡。然后,这些记分卡用于识别治理工作并确定其优先级,以使最重要的数据生产就绪。 

从哪儿开始?如果您的数据库元数据较差,那么就建议您先评估现有资产的质量和内容。自动化工具可以填充元数据存储库,作为创建记分卡的基础。使湖泊的内容和质量透明是迈向大数据治理的第一步。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 未来,数据治理或将成为企业新的业务增长点

    未来,数据治理或将成为企业新的业务增长点

    大数据在我们中国发展的十年时间里面,从稚嫩逐渐走向成熟,现在已经比较普遍的应用于市场中,并且全球的IT企业很重视这方面。那么这些企业都普……查看详情

    发布时间:2019.09.20来源:知乎浏览量:154次

  • 2019年的数据前景如何

    2019年的数据前景如何

    这三个与数据相关的趋势今年值得关注。 公司喜欢技术堆栈所有层的“即服务”模式,从云供应商提供的基础架构到完整的SaaS应用程序。但是……查看详情

    发布时间:2019.01.07来源:数据治理浏览量:190次

  • 你以为建设大数据平台就好了,还差这一步

    你以为建设大数据平台就好了,还差这一步

    长期以来,大家一直忽略一个问题:数据跟原来的企业应用系统一样,它是需要被管理的。企业逐渐了解数据所蕴含的价值,对数据的重视程度越来越高。……查看详情

    发布时间:2019.06.03来源:亿信华辰浏览量:152次

  • 数据湖与数据仓库之间的桥梁

    数据湖与数据仓库之间的桥梁

    数据湖的吸引力和新颖的功能对传统的数据仓库(DWH)系统构成了巨大的威胁。DWH的主要缺点包括与不适应不断发展的数据环境的刚性内部结构相……查看详情

    发布时间:2021.07.26来源:亿信华辰数据治理知识库浏览量:198次

  • 什么是数据标准?如何建设管理?这篇文章给你讲明白了

    什么是数据标准?如何建设管理?这篇文章给你讲明白了

    数据标准是一套由管理制度、管控流程、技术工具共同组成的体系,通过这套体系来推广和应用统一的数据定义、数据分类、纪律格式和转换、编码等来对……查看详情

    发布时间:2020.11.11来源:头条浏览量:317次

  • 关于数据治理的十件事

    关于数据治理的十件事

    数据治理是我们现在遇到的众多热门词汇之一。有人可能会说这是炒作,但我不这么认为。出于许多好的理由,这是我们的首要考虑,其中一些我们在下面……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:223次

  • 亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    近20位行业大咖和领导,来自全国451所学校的1386位教育信息化专家、院校领导及企业负责人参与了此次大会,针对服务治理、数据治理、高等……查看详情

    发布时间:2018.10.15来源:亿信华辰浏览量:153次

  • 以数据中台为切入点,场景/应用驱动源头数据治理

    以数据中台为切入点,场景/应用驱动源头数据治理

    数据中台通常是应用驱动构建,所处理的数据是业务关心和使用的数据。在数据中台开发与运营服务的过程中,面临很多源头数据的问题,比如不同系统的……查看详情

    发布时间:2020.04.01来源:知乎浏览量:211次

  • 侃侃什么是数据资产管理,数据资产到底是什么

    侃侃什么是数据资产管理,数据资产到底是什么

    近几年来,“数据就是资产”的观念已成为共识,大家对数据价值的重视程度与日俱增,数据资产管理也已被众多企业提上日程……查看详情

    发布时间:2020.08.19来源:微信浏览量:202次

  • 数据交换如何“主动出击”?

    数据交换如何“主动出击”?

    传统的数据交换,一般说来是用户根据自身的数据抽取需求,配置好相关的设置,定义好数据抽取时间来进行数据交换。这是一种被动式的数据交换,如果……查看详情

    发布时间:2020.09.27来源:头条浏览量:163次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议