赢得数据治理的五个秘诀

发布时间:2019.02.27来源:亿信华辰浏览量:121次标签:数据治理


到目前为止,您已经意识到拥有出色的数据分析策略还需要拥有良好的数据治理策略。毕竟,如果您的数据无法控制,那么您在其上运行的分析在一天结束时将是不值得信任的。

那么获胜的数据治理策略是什么样的呢?成功的数据治理策略有很多要素,但这里有五个不容忽视的方面:

1.拥抱数据孤岛

多年来,数据孤岛一直是数据分析师和数据科学家的第一对手。当数据分布在许多存储库中时,我们的想法就是设计和构建数据分析应用程序变得更加困难。

好吧,这是真的:数据孤岛确实让数据科学家和数据分析师的生活更具挑战性。但事情就是这样:没有人可以做到这一点。我们已经指示在像Hadoop这样的大数据商店上建立湖泊并尽可能地集中数据,而理论上它在实践中是一种优越的方法 - 而不是那么多。

“当然,每个人都希望在所有数据源中找到企业的单一参考点,”数据目录和治理软件提供商Alation的营销副总裁Stephanie McReynolds说。“但是众所周知,在过去五到七年里,数据来源如此激增,以至于不可能将所有内容合并到一个地方。”

但这并不全是坏事。这里有一些好消息:来自Alation和其他供应商的现代数据治理工具并不真正关心数据的位置,它们有助于简化编目过程,然后访问数据,无论它位于何处。

McReynolds看到Hadoop数据湖的持续采用,但她也看到组织将数据从内部存储库转移到基于云的商店。像Alation这样的数据治理工具可以随时随地跟踪数据。

“无论数据位于何处,”通货膨胀都是一致的界面,“她说。“这减少了分析师和数据科学家访问这些数据的界限或障碍。他们不必日复一日地关注数据集的移动位置。无论身体在哪里,他们都能找到它。“

2.规划大事

数据分析项目通常规模较小,但如果收益为正,它们可以快速增长。产品管理高级副总裁兼生产数据分析和数据管理软件的公司Infogix表示,在项目投入生产时具有这种规模的组织可以更好地解决数据治理挑战。

“当企业开始收集数据,它往往是在小范围内是可管理的,”华盛顿告诉Datanami。“但是,由于决策是基于分析结果做出的,因此组织开始看到数据收集的真正价值,并且正如您所猜测的那样,开始收集更多数据。但随着他们积累更多数据,组织往往失去对数据质量,来源,所有权的控制 - 这是成功数据治理计划的所有关键组成部分。“

解决这一共同障碍的第一步是确保每个人都说同一种语言。“数据字典,业务术语表和数据沿袭不仅定义了不同业务部门的数据和术语,还提供了有关数据来源,年龄和相互依赖性的关键信息,”华盛顿说。

一种解决所有问题的数据治理策略 - 不仅包括定义数据和术语,还包括数据来源,如何使用,数据源之间的关系,数据质量维度和分数,以及她说,数据的所有者和管家对于让利益相关者参与是至关重要的。

“如果用户不知道数据源自何处,他们可能不会信任它,而且他们通常不会使用它,”华盛顿说。

3.重新考虑自助式分析

大数据分析行业的一个标志就是希望将数据和分析推向尽可能多的人。思维方面,组织中拥有数据和自助服务分析能力的人越多越好。

McReynolds说,虽然自助服务分析是一个令人钦佩的长期目标,但它在短期内引发了一些数据治理挑战。

“有两个不同的角度让你的数据得到解决,”她告诉Datanami。“您可以如何组织原始源数据。第二个角度,相关但可能不那么明显,是消费方面发生的事情,以及自助服务分析在短期内实际造成的混乱。“

McReynolds说,组织通过将数据放在更多员工面前来实现竞争优势,但这会带来损失。“很高兴我们允许组织中的这么多人访问数据,我们鼓励他们做出数据驱动的决策,”她说。“但Tableau和Qlik以及一些更现代化的自助服务分析工具的植入也产生了一些洞察力,这些洞察力并未与原始源数据完全联系起来。”

实施数据治理策略有助于消除在两个方面创建的一些粗糙边缘。“在这两个目标 - 最后一英里和第一英里 - 我们今年要解决数据治理问题。”

4. GDPR只是一个开始

在通用数据保护条例(GDPR)生效之前还有113天。如果你还没有开始修复程序,那么到5月25日结束的几率是微不足道的。不过不要担心,公司的CEO费利克斯·范·德·Maele说Collibra,这使得软件的管理和编目数据。


“5月25日是GPDR的截止日期,但不是结束。这真的是一个开始,“Van de Maele说。“我认为你会看到一些例子,监管机构会想要确保公司明白这一点很重要,他们希望这些例子符合要求。”

这并不意味着你应该推迟考虑数据治理,直到欧盟委员会的竞争委员会对Facebook或谷歌(或任何可能的人)进行罚款。相反,客户应将GDPR合规性和数据治理视为将随着时间的推移而变化和发展的持续挑战。

“我认为在[GDPR]截止日期之后我们会看到的是采用技术的另一个阶段,以帮助使这些计划更具可持续性,”Alation的McReynolds说。“重点不仅仅是清点数据......而是能够标记和管理数据,因为消费者会从培训算法或实时算法中提取个人消费者数据。我们将开始看到随着时间的推移制定系统以满足这些要求。“

5.授权你的CDO

成功实施大数据治理策略最容易被忽视的一个方面就是拥有合适的人员。虽然没有一个单独的玩家组合可以自动导致成功,但如果您有首席数据官(CDO)角色,则可能会有利于您。

“理想情况下,应该有一个CDO来监督和促进数据治理计划的执行,以确保高管的赞助,”Infogix的华盛顿说。“其他直接参与者应包括执行领导,项目管理,数据管理员(可能存在于IT或跨越业务和职能部门的更联合模式)和主题专家。但考虑到数据治理的目标,组织内的所有角色都可以在其实施成功中发挥作用。数据治理的关键是确保整个企业的协作。

CDO将负责平衡现代数据分析团队最终必须处理的竞争优先事项 - 具体而言,确保数据分析不会因为过度管理的流程而过于严格,而且他们不会在没有足够的过程的情况下,过于疯狂地扩散。

“我认为CDO是正确的角色,”McReynolds说。“你需要在自上而下的强制执行和最低限度的基层数据使用之间取得平衡。如果你把这个责任移到CDO之外,我认为你冒着朝着一个方向或另一个方向过于激进的风险。锁定的分析环境无法很好地发现新的算法和新的战略分析见解。“

显然,在数据治理方面取得的成功要比我们在此处介绍的要多得多,但希望这些见解能够在您发展数据治理策略时为您提供一些思考。





(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 以数据中台为切入点,场景/应用驱动源头数据治理

    以数据中台为切入点,场景/应用驱动源头数据治理

    数据中台通常是应用驱动构建,所处理的数据是业务关心和使用的数据。在数据中台开发与运营服务的过程中,面临很多源头数据的问题,比如不同系统的……查看详情

    发布时间:2020.04.01来源:知乎浏览量:133次

  • 数据治理与数据管理:有什么区别?

    数据治理与数据管理:有什么区别?

    如果今天有任何定义成功企业的东西,那就是公司数据的成功理解,使用和策略。……查看详情

    发布时间:2019.01.02来源:亿信华辰浏览量:132次

  • 数据治理管理干货 | 数据质量管理的方法

    数据治理管理干货 | 数据质量管理的方法

    原始数据通常包含错误,如果不做数据质量管理,可能会导致错误的结果。数据质量管理是数据治理中获得正确上下文和结论的基本步骤。……查看详情

    发布时间:2021.06.22来源:亿信数据治理知识库浏览量:149次

  • 数据标准从发起到落地执行的四个阶段

    数据标准从发起到落地执行的四个阶段

    数据标准的设计从需求发起到落地执行,一般需要经过标准编制、标准审查、标准发布、标准贯彻四个阶段:……查看详情

    发布时间:2020.09.24来源:知乎浏览量:108次

  • 不治理就破产—谈大数据时代的数据治理

    不治理就破产—谈大数据时代的数据治理

    随着Hadoop技术的提升,数据如何进来,如何整合,开展什么样的应用都已经有了成熟的案例,可是,同传统数仓时代一样,垃圾进垃圾出,如何破……查看详情

    发布时间:2019.02.21来源:知乎浏览量:101次

  • 一张架构图告诉你数据中台如何搭建

    一张架构图告诉你数据中台如何搭建

    当下,刮起了一场数据中台风,立马席卷了大数据行业的各个角落。人人都在谈什么是数据中台,我们需不需要建数据中台,数据中台要怎么建?今天,小……查看详情

    发布时间:2020.10.15来源:数据中台浏览量:115次

  • 数据治理和数据管理推动成功的词汇表和词典

    数据治理和数据管理推动成功的词汇表和词典

    任何数据管理员的噩梦都是运行会议,创建迂腐和无关的业务词汇表或数据词典,最终收集网络粉尘。但是,跳过构建和维护良好的业务术语表或数据字典……查看详情

    发布时间:2019.02.21来源:亿信华辰浏览量:135次

  • 数据交换平台是数据中心与其它应用系统沟通的桥梁

    数据交换平台是数据中心与其它应用系统沟通的桥梁

    数据交换平台是数据中心与其它应用系统沟通的桥梁,是进行数据交换的枢纽站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按……查看详情

    发布时间:2020.08.10来源:知乎浏览量:94次

  • 关于数据治理的十件事

    关于数据治理的十件事

    数据治理是我们现在遇到的众多热门词汇之一。有人可能会说这是炒作,但我不这么认为。出于许多好的理由,这是我们的首要考虑,其中一些我们在下面……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:147次

  • 什么是主数据?

    什么是主数据?

    企业主数据(Master Data)是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值……查看详情

    发布时间:2020.04.29来源:知乎浏览量:157次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议