重新思考数据治理

发布时间:2018.11.26来源:数据治理浏览量:222次标签:数据治理

随着数据和分析技术的变化,它们带来了新的数据治理挑战。当然,数据治理有各种定义,具体取决于您询问的对象。出于本文的目的,我们将其定义为确保数据生命周期中所有点的数据正确使用,完整性和安全性的实践。换句话说,它是如何管理公司数据的计划或“转向”。这是一个不断发展的生态系统。

涵盖企业数据仓库(EDW)系统的传统治理措施仍然适用,但角色,最佳实践和功能正在发生变化。治理实践必须考虑现代数据技术和用例。例如,我们看到许多公司现在将原始数据源存储在数据湖中,并为未预料到的用例“即时”集成它们。在其他情况下,角色随着技术而变化。数据管理员现在是倡导者 - 而不是看门人 - 因为不同业务部门之间的数据共享受到鼓励。

随着数据的期望和用例的增长和发展,您的思考方式和管理数据的要求也会发生变化。您需要开发一个更新的治理策略,以解决分布式数据平台带来的变化,不断变化的治理角色,数据用例的爆炸性以及业务发展的不断变化。

在这篇文章中,我们将详细描述数据治理领域的变化,这些变化如何帮助您从数据中获得更多价值,以及您和您的组织可以采取哪些措施来适应这些变化。

旧的方式正在发生变化

在传统的数据平台中,数据来自少量策展源,被加载到RDB或EDW系统中,并通过BI报告工具进行分析(图1)。

图1:传统数据管道示例

在这样的环境中,数据管理员能够提前策划数据,因为数据分析用例的数量是已知且有限的。由于策划数据所涉及的工作,向模式添加字段或修改模式是一个漫长的过程。只有在仔细审查和广泛审查后才会添加新的数据来源。

然而,今天,公司需要访问许多新类型的数据以进行探索和分析。由于公司已将这些新的非结构化数据源放在分布式数据平台中,因此数据不再仅存储在EDW中用于报告。某些数据文件甚至是“读取架构”,其中在确定用例并进行数据访问之前未定义架构。

为了增加一些挑战,随着这些动态集成案例的复杂性增加,数据质量和数据沿袭跟踪变得更加重要,特别是在涉及监管和合规性时。今天的数据管道要复杂得多(图2)。数据来自更多来源,存储在许多地方,不断完善,并可用于许多新类型的服务和应用程序。

图2:现代数据管道示例

一种常见的下意识反应是公司采用其现有的数据治理实践,即在唯一的数据存储是EDW时设计的实践,并将其应用于这些新技术和需求。这可能感觉很舒服,但最终旨在与灵活性较低的系统一起使用的政策和用例最终会扼杀创新而不是启用它。这是推动数据治理现代化的动力所在。

需要改变什么?

为了研究数据治理需要改变什么,让我们从三个高级领域开始:

  1. 数据治理运营模型
  2. 关于数据管理的观点,功能和流程(我们将管理权定义为负责管理和数据的可用性)
  3. 信息生命周期管理的视图,功能和流程

注意:这三个组件本身并未发生变化,但相关活动,实践或技术如何应用于数据。

数据治理运营模式的变化

以前,IT中的单个人或团队通常会针对业务线进行治理。现在,随着更多数据共享,数据治理专业人员必须跨业务线进行协作。因此,数据治理更加协作,实际上集中和混合运营模式,并且可能由首席数据官(CDO)负责。

数据管理变更

数据管理的角色和目标现在专注于识别和实现您从数据中获取价值的方式。数据管理员现在充当数据倡导者,鼓励在以前只在孤岛中工作的不同业务线之间共享数据。管理员现在不会负责精心清理和管理数据,而是像数据管理员那样负责数据,确保数据可用,并且可以针对意外的用例进行集成。而不是通过书本数据监控,管理员现在充当数据管理员,在考虑数据质量时对潜在用例采取更全面的观点。

数据生命周期管理的变化

现在数据架构包括EDW和分布式数据平台(DDP)系统,信息生命周期管理的治理流程也相应发生了变化。EDW数据的政策仍然存在,但是新的数据已经出现在进入DDP的数据中。正如我们前面提到的,该技术更加灵活,因此不再需要数周或数月的时间来摄取新的数据源。由于它不必遵守严格的模式,因此可以在几天内或甚至更快地添加新数据。一旦摄取了新数据,它就以原始格式存储,而不是预定义的模式。如果没有这些预定义的模式,元数据捕获和管理也变得更加重要,从而实现数据分类和探索。

图3总结了这三个维度的变化。

图3:数据治理的变化

虽然它们最初可能看起来势不可挡,但这些变化实际上可以为您的公司带来显着的竞争优势。适当的数据治理有助于降低成本,实现更好的决策,并通过数据共享增强协作。

你接下来的步骤是什么?

要真正利用现代数据治理提供的功能,您必须对您从何处开始进行诚实的评估。跟着这些步骤:

  • 确保您的组织具有数据治理的计划和目标,包括确定您的治理优先级。所有这些都应符合您更大的业务目标。
  • 仔细查看您的数据治理角色,策略和实践。他们中的任何一个都过时了吗?
  • 专注于您想要创建的结果和行为。确保您正确地平衡风险与从数据中获取额外价值的能力。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 没有妥协的数据治理

    没有妥协的数据治理

    在考虑当今现代企业中数据的规模和规模时,显然需要一种全新的数据治理方法。与此同时,数据治理一直是企业范围内的问题 - 而不是大数据特有的……查看详情

    发布时间:2018.11.22来源:数据治理浏览量:195次

  • 数据中台如何进行数据治理

    数据中台如何进行数据治理

    数据中台可通过数据需求、数据质量、元数据管理等领域加强数据治理。……查看详情

    发布时间:2020.04.01来源:知乎浏览量:376次

  • 什么是自适应数据分析和数据治理?

    什么是自适应数据分析和数据治理?

    自适应数据和分析治理,这种方法可帮助企业保持相关性并响应组织内部和外部的快速变化的环境。在自适应数据和分析治理中,数据治理不仅仅是约束和……查看详情

    发布时间:2021.06.02来源:亿信华辰数据治理知识库浏览量:173次

  • 数据管理政策:数据治理的基石

    数据管理政策:数据治理的基石

    您的组织可能认为或可能不认为您需要,但我在此告诉您,数据管理策略是管理企业数据资产的基石。……查看详情

    发布时间:2019.01.22来源:亿信华辰浏览量:235次

  • 企业何时进行数据治理才是最佳时机

    企业何时进行数据治理才是最佳时机

    找准数据治理的切入点,是关乎数据治理成败的关键。如果将数仓建设分为数仓雏形阶段、数仓迭代阶段和能力沉淀阶段,数据治理应该在哪个阶段切入为……查看详情

    发布时间:2020.06.30来源:知乎浏览量:153次

  • 数据共享,奇葩证明的解药——亿信华辰

    数据共享,奇葩证明的解药——亿信华辰

    出境旅游,要求出具“母子关系证明”;市民迁户口,要证明“你爸是你爸”;车在大风中被树木刮伤,理赔要出示“风力证明”;去买房,要证明“结婚……查看详情

    发布时间:2019.03.04来源:亿信华辰浏览量:195次

  • 大数据环境下数据质量管理面临的挑战

    大数据环境下数据质量管理面临的挑战

    随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:225次

  • 主数据管理主要管理哪些数据?

    主数据管理主要管理哪些数据?

    主数据主要管理多百个业务系统中共享的重要数据,比如公司组织架度构、物料编号、客户资料等等数据,国知辰机器人的主数据管理系统(MDM)能够……查看详情

    发布时间:2020.04.29来源:知乎浏览量:198次

  • 数据质量和数据治理之间有什么区别?

    数据质量和数据治理之间有什么区别?

    跟上无穷无尽的技术术语可能是一项艰巨的任务。松散定义的术语和行业特定的白话使水更加泥泞。特别是在数据管理方面,似乎许多单词也可以互换使用……查看详情

    发布时间:2019.07.04来源:知乎浏览量:194次

  • 什么是元数据?元数据管理的作用是什么?

    什么是元数据?元数据管理的作用是什么?

    为了更好地理解企业拥有的数据,必须访问关联的元数据。 元数据管理帮助您判断数据来自何处,其在不同系统中的位置以及如何使用。元数据用于管理……查看详情

    发布时间:2021.03.31来源:数据治理研究院浏览量:401次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议