大数据治理的新范例

发布时间:2018.12.26来源:亿信华辰浏览量:174次标签:数据治理


数十年来,数据科学家已经拥有沙箱来探索数据并找到有价值的见解。在看似愉快的折衷方案中,分析师可以快速加载,操纵和组合企业和行业数据,以寻找新的见解和预测,而无需担心它们会危及敏感数据或生产工作流程。虽然这加速了创造新的见解,但将它们投入生产是一场噩梦。在未部署的环境中创建的一组自定义代码和数据需要在部署之前进行转换,质量控制和优化。企业通常需要一年的大部分时间才能从几周内收集的洞察中获得价值。 

大数据的幽灵有可能使情况变得更糟- 在很大程度上。现在,分析师们正在使用IT外部的数据结构和编程语言。外部数据源的数量和复杂性正在爆炸式增长。如果没有新的方法,在大数据沙箱中发现的洞察力可能永远不会投入生产。 

所出现的是一种新的范例,它将数据治理- 大多数分析师的诅咒这一术语 - 带入了大数据。但是,大数据治理不是严格限制数据使用和文档,而是灵活,协作和高效。它使分析师参与而非分离,以获取他们的学习以加速生产准备。最重要的是,它取代了沙箱数据的大规模转换,并采用“促销”流程,确保分析数据在大数据平台上生产就绪。 

大数据治理要求我们从头开始重新思考治理。大数据治理不是物理地分离沙箱和生产数据,而是逻辑地控制访问和使用,因为数据从“原始”到“准备”成熟。您如何判断数据是否已准备好生产?元数据。任何支持生产使用的大数据平台都必须具有跟踪数据摄取,验证,准备和使用生命周期的元数据。元数据需要管理数据访问权限,捕获数据分析结果以及数据开发人员和最终用户的评论。元数据存储定义生产准备的策略,并能够实施它们。没有元数据,数据湖就变成了数据沼泽。 

但为了实现这一点,元数据捕获必须是自动化和相关的。大数据治理的第二个原则与当前的教条相矛盾:从一开始就使用模式来丰富元数据。大多数业务数据都是结构化的,无论是关系数据库,日志文件,XML还是大型机副本。该结构可用于自动评估原始数据的质量,完整性和内容。这不仅为分析师提供了对数据的洞察力,还建立了一个可以构建的元数据基础。

大数据治理的第三个原则是记分卡驱动的优先级。并非所有数据都需要严格的质量和访问管理。实际上,假设大多数原始数据都不会被使用- 因此丰富其元数据是浪费时间。相反,记分卡是为数据的各种用途而创建的 - 合规报告,营销分析,供应链分析等。某些策略适用于所有记分卡 - 需要屏蔽PII数据 - 其他则非常具体 - 需要数据沿袭所有合规报告。使用元数据基础,可以轻松地为任何数据集创建记分卡。然后,这些记分卡用于识别治理工作并确定其优先级,以使最重要的数据生产就绪。 

从哪儿开始?如果您的数据库元数据较差,那么就建议您先评估现有资产的质量和内容。自动化工具可以填充元数据存储库,作为创建记分卡的基础。使湖泊的内容和质量透明是迈向大数据治理的第一步。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 一个通用的数据中台架构应该如何构建,本文告诉你答案

    一个通用的数据中台架构应该如何构建,本文告诉你答案

    这两年,越来越多的大数据从业者提到“数据中台”的概念。在信息系统建设工作中,我们熟知系统可以分为前台和后台,但什么是中台,每个人的理解并……查看详情

    发布时间:2020.11.18来源:知乎浏览量:174次

  • 完善数据治理的制度设计

    完善数据治理的制度设计

    作为最具时代特征、最活跃的生产要素和价值创造来源,“数据”首次出现在《决定》的文本之中。这既反映了经济社会数字化转型不断加快的特征事实,……查看详情

    发布时间:2020.10.31来源:知乎浏览量:169次

  • 大数据环境下的数据质量管理策略

    大数据环境下的数据质量管理策略

    信息时代,数据已经慢慢成为一种资产,数据质量成为决定资产优劣的一个重要方面。随着大数据的发展,越来越丰富的数据给数据质量的提升带来了新的……查看详情

    发布时间:2019.11.06来源:知乎浏览量:210次

  • 物联网为什么需要动态数据交换

    物联网为什么需要动态数据交换

    物联网承诺为数据的创建和交换提供一个激动人心的未来,这些数据可以改变业务流程并推动下一轮创新。然而,在建立为这个新市场提供流动性的数据交……查看详情

    发布时间:2019.01.15来源:亿信华辰浏览量:182次

  • 数据中台与数据仓库相比的四大优势

    数据中台与数据仓库相比的四大优势

    数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。因此,其重点在于数据的集合。数据仓库可使用维度建……查看详情

    发布时间:2020.11.21来源:知乎浏览量:215次

  • 大数据时代不能没有数据治理

    大数据时代不能没有数据治理

    第一个提出大数据时代到来的是全球知名咨询公司麦肯锡,现如今大数据存在于各个行业,受到了人们的重视。现在社会科技告诉发展,信息流通快,使得……查看详情

    发布时间:2019.08.13来源:知乎浏览量:158次

  • 数据治理的概念、难点和最佳实践方法

    数据治理的概念、难点和最佳实践方法

    数字化转型的目的和核心是数据赋能业务,通过智能数据归一、数据统一治理与服务、数据实体化融合、数据资产化的方式,帮助实现业务转型、创新和增……查看详情

    发布时间:2021.08.06来源:亿信华辰,数据治理的实践方法浏览量:189次

  • 如何实现数据治理合作交流的4点建议

    如何实现数据治理合作交流的4点建议

    数据如同工业的石油一样,成为国家的重要资源,成为推动经济社会增长和发展的重要引擎。大数据、云计算、人工智能是大势所趋,发展这些技术也是人……查看详情

    发布时间:2019.10.25来源:知乎浏览量:186次

  • 银监会拟要求银行业金融机构加强数据治理

    银监会拟要求银行业金融机构加强数据治理

    银行业金融机构将数据治理纳入公司治理范畴,明确数据管理和数据质量控制的要求,鼓励银行业金融机构开展制度性探索,结合实际情况设置首席数据官……查看详情

    发布时间:2019.10.18来源:新华网浏览量:171次

  • 企业数据治理到底怎么做?

    企业数据治理到底怎么做?

    数据治理对于确保数据的准确、适度分享和保护是至关重要的。有效的数据治理计划会通过改进决策、缩减成本、降低风险和提高安全合规等方式,将价值……查看详情

    发布时间:2019.08.30来源:知乎浏览量:203次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议