使用知识图技术实现数据治理2.0

发布时间:2019.02.21来源:亿信华辰浏览量:167次标签:数据治理

数据治理

Polikoff说,15到20年前,我们现在称之为数据治理的是企业架构。当时的目标是捕获有关企业数据处理的所有信息 - 这是一项昂贵且耗时的任务,Polikoff将其比作“沸腾海洋”.Coyne同意Polikoff并补充说,在试图记录所有存在的连接时,一小群非常技术性的人会用巨大的图表为一个房间壁纸。从这个过程来看,技术方面确实得到了一种理解,但对于商业用户而言,它太复杂且无法获取。

通过限制数据存储和应用程序的大小和数量来使这项任务更易于管理的努力随着时间的推移不成功,因为在很短的时间内,最多几年,在每次“合理化”努力之后,公司最终将获得两倍的成本Polikoff说,数据就像他们开始时一样。“这只是业务的本质。”

由于数据存储和来源的激增以及处理的复杂性日益增加,数据管理的需求从数据管理的角度慢慢出现。她说,了解数据的背景变得更加重要。

“如果你试图描述你的数据以便更好地管理它,你必须从它的使用方式来描述它。捕获围绕数据创建和使用的上下文是必要的,而这基本上就是企业架构。“

与支持事务处理的典型操作系统不同,数据治理系统是关于跨数字环境的连接,因此必须拥有一个能够灵活地,逐步建立对不同利益相关者有意义的连接的平台,她说。“现在我们看到企业数据治理空间必须是一个基本的业务驱动的活动,而不是IT驱动的活动,”Coyne补充说。

霍奇森表示,要依赖元数据进行上下文,就需要对正在发生的事情保持忠诚度或“敏锐度”。“所以你不要只抓取一次元数据,你要继续检查元数据是否应该是这样的。”使用数据架构,一旦建立模型并且“壁纸”启动,企业就会发生变化。图表已过时。“改变是重新构建数据治理而不是数据架构的关键驱动因素,”他说。

Coyne表示,数据治理旨在提供从业务到最技术元素的数据生命周期的全面视图。人们有时会认为他们拥有有效的数据治理,因为他们只拥有整个生命周期的一小部分。但是,整个数据生态系统中更具连接性,全面的生命周期能力是当今世界所需要的,以实现他所谓的数据治理2.0。

“许多已经存在很长时间的现有技术工具提供了一个部分,但未来,我们需要一个更全面的解决方案,而知识图方法在这方面发挥着重要作用,”他说。

Hodgson认为,不同级别的人员与公司的元数据有不同的关系。有些人正在使用数据治理。

“他们不只是收集元数据,他们想要做点什么 - 也许是它的血统,也许它是合规的,也许它正在弄清楚他们需要存档什么,他们需要存档多长时间。”

其他人正在收集元数据,有些小组正在与之互动,因为他们正在处理一个项目。“将所有这些结合在一起需要一种数据治理以前没有的方法论。”

知识图技术

知识图通常用于社交网络中,用于在线交易中的欺诈检测,以及作为推荐引擎。知识图表具有适应性,可重用性和增强性,将灵活性与结构和意义相结合。

使用知识图和图数据库的简单结构可以实现强大的企业级关联。镜像我们的思维方式,知识图使用一组节点,边和属性来表示和存储数据。数据点之间的关系通常比单个点本身更重要。

TopQuadrant将知识图定义为一组互连的信息,能够有意义地桥接企业数据孤岛,并通过关系提供组织的整体视图。

由于企业数据是企业最重要的资产之一,因此通过企业生态系统中所有资产的连接来捕获其全部的技术和业务环境,是有效数据治理的基础。最好的方法是通过开放,可扩展和智能的方法。Hodgson表示,实现这一目标的一个有效方法是通过Knowledge Graphs。

为什么知识图表很重要?

霍奇森概述了知识图为数据建模过程提供的四个关键能力:

  • 可扩展性:能够适应随时间演变的各种数据和元数据
  • 内省/查询能力:可以检查模型以找出可知和可查找的内容
  • 语义:数据的含义与数据一起存储在图表中以理解连接
  • 智能启用:推断对象之间的依赖关系和其他关系的能力

TopQuadrant

TopQuadrant的使命是使信息有意义,从而赋予人们权力。他们认为他们对语义Web标准的承诺是他们成功的关键部分。语义Web是当前Web的增强,其中含义(即语义)是机器可处理的。拥有使用计算机理解的词汇表的数据可以更轻松地查找,共享和组合数据/信息。

Polikoff表示,客户需求导致使用公认的语义标准管理词汇表,然后公司使用知识图谱技术扩展产品并管理所有类型的元数据:结构化,非结构化,业务,技术,操作等。“您需要拥有为了帮助在数据治理领域工作的人,某种程度的自动化,“她说,所以他们增加了有监督的机器学习,使”认知数据治理“成为可能。正如霍奇森所说,“数据治理是关于连接事物的,所以我们创建了一个利用知识图来建立全面关系的平台。”

TopBraid

TopBraid企业数据治理解决方案使用知识图,规则和受监督的机器学习来管理元数据并解决数据治理的所有三个方面:

  • 执行治理:创建控制,流程和策略,或者如果它们已经非正式存在则将其正式化
  • 代表性治理:创建要捕获的信息模型,例如词汇表,数据源,应用程序,参考数据等,并使用这些模型来描述这些资产
  • 应用治理:使用捕获的信息来满足特定需求。对某些人来说,可能是评估数据源变化影响的能力。对于其他人,它可能是为了追踪数据沿袭以满足法规遵从要求。另一个共同目标是提高数据的质量和一致性

霍奇森说他现在看到元数据孤岛面对需要跨越生态系统景观的人们“弄清楚什么在移动,它来自哪里,在哪里,以及它如何影响事物”,他将这种情况比作铁路系统。他认为该行业面临的最大问题是每个供应商都提供自己独特的模型。“我们有一个开放的架构模型。我们使用标准。这是人们开始意识到并欣赏的东西,“他说。

他在TopQuadrant担任首席技术官的职责是打破复杂性,找到为商务人士和技术人员提供有用体验的最佳方式。他看到对知识图(又称语义技术)以及数据治理可以提供的价值的兴奋日益增加。“人们不希望只有漂亮的照片。当他们进行数据治理时,他们希望确保它具有影响力。“


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理面临的挑战

    数据治理面临的挑战

    本部分的内容将数据治理面临的挑战分为两类,一类因“技术”而起,一类因“人”而起。由客观的技术问题对数据治理带来的挑战普遍较好解决,比如如……查看详情

    发布时间:2019.11.01来源:知乎浏览量:189次

  • 管理、选择性投资推动了Hmshost的多渠道数字化之旅

    管理、选择性投资推动了Hmshost的多渠道数字化之旅

    hmshost利用跨渠道数据优化饥饿旅客的用餐体验。……查看详情

    发布时间:2019.01.15来源:亿信华辰浏览量:149次

  • 数据质量对于数据分析来说至关重要

    数据质量对于数据分析来说至关重要

    数据质量的关键所在包括:大致分为完整性,一致性,准确性,有效性和及时性这五个组件。……查看详情

    发布时间:2019.11.13来源:知乎浏览量:151次

  • 2019年专注于稳健数据治理的合规性,质量和定制

    2019年专注于稳健数据治理的合规性,质量和定制

    数据治理,组织内数据的正确和有组织的管理,仍然是2019年的一个焦点。对于希望充分利用其数据的组织,他们必须建立系统以确保数据的正确性,……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:113次

  • 数据共享交换平台解决方案

    数据共享交换平台解决方案

    数据交换平台是业务系统间无缝共享数据、连通信息孤岛的高速公路,由数据交换管理模块、核心元数据审批模块、适配器模块、数据传输设计模块,权限……查看详情

    发布时间:2020.04.23来源:知乎浏览量:191次

  • 数据安全治理的基本思路

    数据安全治理的基本思路

    我们的世界正在进入一个奇怪的分裂状态:一方面人们为大数据时代即将在各个领域发生的革命性进步而激动难眠,另一方面人们也在为数据安全和隐私保……查看详情

    发布时间:2019.06.14来源:数据杂志浏览量:148次

  • 数据治理在有效合规计划中的作用

    数据治理在有效合规计划中的作用

    有效的合规计划由许多活动部分组成。关键数据来自运行操作所需的各种工具,文档,系统和技术。因此,企业在试图获得任何特定时间的风险状况的完整……查看详情

    发布时间:2018.12.20来源:亿信华辰浏览量:162次

  • 如何做好银行金融大数据治理平台建设

    如何做好银行金融大数据治理平台建设

    大数据、云计算、互联网等技术,将人类带入了一个以PB为单位的大规模生产、分享和应用数据的新时代。当治理的对象发生变化时,治理体系也应进行……查看详情

    发布时间:2019.10.15来源:知乎浏览量:241次

  • 大数据时代还需要数据治理吗?

    大数据时代还需要数据治理吗?

    第一个提出大数据时代到来的是全球知名咨询公司麦肯锡,现如今大数据广泛存在于政府,军事,金融,企业,医疗,制造业,电力等行业,备受关注。……查看详情

    发布时间:2019.08.15来源:知乎浏览量:134次

  • 数据治理是建设数据中台的核心数据价值的释放之匙

    数据治理是建设数据中台的核心数据价值的释放之匙

    随着数据价值的日益突显,越来越多的企业开始进行数字战略转型,有的通过数据平台过渡到数据中台,有的直接建设数据中台。……查看详情

    发布时间:2020.06.23来源:知乎浏览量:136次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议