大数据治理的新范例

发布时间:2018.12.26来源:亿信华辰浏览量:147次标签:数据治理


数十年来,数据科学家已经拥有沙箱来探索数据并找到有价值的见解。在看似愉快的折衷方案中,分析师可以快速加载,操纵和组合企业和行业数据,以寻找新的见解和预测,而无需担心它们会危及敏感数据或生产工作流程。虽然这加速了创造新的见解,但将它们投入生产是一场噩梦。在未部署的环境中创建的一组自定义代码和数据需要在部署之前进行转换,质量控制和优化。企业通常需要一年的大部分时间才能从几周内收集的洞察中获得价值。 

大数据的幽灵有可能使情况变得更糟- 在很大程度上。现在,分析师们正在使用IT外部的数据结构和编程语言。外部数据源的数量和复杂性正在爆炸式增长。如果没有新的方法,在大数据沙箱中发现的洞察力可能永远不会投入生产。 

所出现的是一种新的范例,它将数据治理- 大多数分析师的诅咒这一术语 - 带入了大数据。但是,大数据治理不是严格限制数据使用和文档,而是灵活,协作和高效。它使分析师参与而非分离,以获取他们的学习以加速生产准备。最重要的是,它取代了沙箱数据的大规模转换,并采用“促销”流程,确保分析数据在大数据平台上生产就绪。 

大数据治理要求我们从头开始重新思考治理。大数据治理不是物理地分离沙箱和生产数据,而是逻辑地控制访问和使用,因为数据从“原始”到“准备”成熟。您如何判断数据是否已准备好生产?元数据。任何支持生产使用的大数据平台都必须具有跟踪数据摄取,验证,准备和使用生命周期的元数据。元数据需要管理数据访问权限,捕获数据分析结果以及数据开发人员和最终用户的评论。元数据存储定义生产准备的策略,并能够实施它们。没有元数据,数据湖就变成了数据沼泽。 

但为了实现这一点,元数据捕获必须是自动化和相关的。大数据治理的第二个原则与当前的教条相矛盾:从一开始就使用模式来丰富元数据。大多数业务数据都是结构化的,无论是关系数据库,日志文件,XML还是大型机副本。该结构可用于自动评估原始数据的质量,完整性和内容。这不仅为分析师提供了对数据的洞察力,还建立了一个可以构建的元数据基础。

大数据治理的第三个原则是记分卡驱动的优先级。并非所有数据都需要严格的质量和访问管理。实际上,假设大多数原始数据都不会被使用- 因此丰富其元数据是浪费时间。相反,记分卡是为数据的各种用途而创建的 - 合规报告,营销分析,供应链分析等。某些策略适用于所有记分卡 - 需要屏蔽PII数据 - 其他则非常具体 - 需要数据沿袭所有合规报告。使用元数据基础,可以轻松地为任何数据集创建记分卡。然后,这些记分卡用于识别治理工作并确定其优先级,以使最重要的数据生产就绪。 

从哪儿开始?如果您的数据库元数据较差,那么就建议您先评估现有资产的质量和内容。自动化工具可以填充元数据存储库,作为创建记分卡的基础。使湖泊的内容和质量透明是迈向大数据治理的第一步。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 做好数据治理才能建设大数据平台

    做好数据治理才能建设大数据平台

    大数据不是凭空而来,1981年第一个数据仓库诞生,到现在已经有了近40年的历史,而国内企业数据平台的建设大概从90年代末就开始了,从第一……查看详情

    发布时间:2018.11.28来源:数据治理浏览量:180次

  • 为什么企业架构需要成熟度模型

    为什么企业架构需要成熟度模型

    跑步之前走路。我们已经听过一百万次了,引用了几乎同样多的不同学科。然而,由于时间有限,想要快速完成任务往往是人性。然而,就像我们的第一步……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:180次

  • 数据治理是一种数据管理概念-维基百科

    数据治理是一种数据管理概念-维基百科

    数据治理是一种数据管理概念,涉及使组织能够确保在数据的整个生命周期中存在高数据质量的能力。数据治理的关键重点领域包括可用性,可用性,一致……查看详情

    发布时间:2018.11.12来源:维基百科浏览量:158次

  • 提高企业数据质量能做些什么?

    提高企业数据质量能做些什么?

    如今,我们生活在数据时代,各种数字化正在实实在在的改变着企业的日常运营,我们的生活、工作、学习,现在都离不开数据,对于企业来说,数据就是……查看详情

    发布时间:2019.11.01来源:知乎浏览量:171次

  • 如何制定数据标准

    如何制定数据标准

    企业的数据标准来源非常丰富,有外部的监管要求,行业的通用标准,同时也必须考虑到企业内部数据的实际情况,梳理其中的业务指标、数据项、代码等……查看详情

    发布时间:2020.11.13来源:知乎浏览量:174次

  • 数据治理—做好这些就够了!

    数据治理—做好这些就够了!

    Gartner预测,“到2023年,75%的数据库都将位于云平台上,从而增加了数据治理和集成的复杂性 ”。随着组织收集更多数据(包括在防……查看详情

    发布时间:2019.03.14来源:亿信华辰浏览量:149次

  • 政府如何进行数据治理

    政府如何进行数据治理

    政府掌握全社会重要核心的、高价值的数据,如何通过有效管理,进行共享开放与协同,释放背后价值,赋能管理、服务决策,推动治理能力的提升对于我……查看详情

    发布时间:2021.08.30来源:亿信华辰浏览量:298次

  • 快速构建集团数据中心!亿利集团这样打通分子公司数据

    快速构建集团数据中心!亿利集团这样打通分子公司数据

    亿利集团利用亿信华辰的数据采集平台i@Report+数据分析展现平台亿信BI(原BI@Report),搭建一站式数据应用平台,平台集数据……查看详情

    发布时间:2019.05.14来源:亿信华辰浏览量:150次

  • 数据标准管理工具最全介绍:背景、功能和案例都在这!

    数据标准管理工具最全介绍:背景、功能和案例都在这!

    数据标准管理工具作为企业开展数据管控的抓手,需要把数据管理制度办法中建立的各项工作流在信息化系统中实现,避免线下流程,这就需要工具能支持……查看详情

    发布时间:2021.08.03来源:亿信数据治理知识库浏览量:1167次

  • 指标管理实践技能:如何让同一套指标体系展示为不同的树形结构

    指标管理实践技能:如何让同一套指标体系展示为不同的树形结构

    企业的指标体系的建设和维护工作非常繁杂,指标的数据来源、指标公式的维护、指标数据的更新、指标数据的应用,往往涉及到企业的多个部门,这些部……查看详情

    发布时间:2021.02.06来源:知乎浏览量:144次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议