使用知识图技术实现数据治理2.0

发布时间:2019.02.21来源:亿信华辰浏览量:161次标签:数据治理

数据治理

Polikoff说,15到20年前,我们现在称之为数据治理的是企业架构。当时的目标是捕获有关企业数据处理的所有信息 - 这是一项昂贵且耗时的任务,Polikoff将其比作“沸腾海洋”.Coyne同意Polikoff并补充说,在试图记录所有存在的连接时,一小群非常技术性的人会用巨大的图表为一个房间壁纸。从这个过程来看,技术方面确实得到了一种理解,但对于商业用户而言,它太复杂且无法获取。

通过限制数据存储和应用程序的大小和数量来使这项任务更易于管理的努力随着时间的推移不成功,因为在很短的时间内,最多几年,在每次“合理化”努力之后,公司最终将获得两倍的成本Polikoff说,数据就像他们开始时一样。“这只是业务的本质。”

由于数据存储和来源的激增以及处理的复杂性日益增加,数据管理的需求从数据管理的角度慢慢出现。她说,了解数据的背景变得更加重要。

“如果你试图描述你的数据以便更好地管理它,你必须从它的使用方式来描述它。捕获围绕数据创建和使用的上下文是必要的,而这基本上就是企业架构。“

与支持事务处理的典型操作系统不同,数据治理系统是关于跨数字环境的连接,因此必须拥有一个能够灵活地,逐步建立对不同利益相关者有意义的连接的平台,她说。“现在我们看到企业数据治理空间必须是一个基本的业务驱动的活动,而不是IT驱动的活动,”Coyne补充说。

霍奇森表示,要依赖元数据进行上下文,就需要对正在发生的事情保持忠诚度或“敏锐度”。“所以你不要只抓取一次元数据,你要继续检查元数据是否应该是这样的。”使用数据架构,一旦建立模型并且“壁纸”启动,企业就会发生变化。图表已过时。“改变是重新构建数据治理而不是数据架构的关键驱动因素,”他说。

Coyne表示,数据治理旨在提供从业务到最技术元素的数据生命周期的全面视图。人们有时会认为他们拥有有效的数据治理,因为他们只拥有整个生命周期的一小部分。但是,整个数据生态系统中更具连接性,全面的生命周期能力是当今世界所需要的,以实现他所谓的数据治理2.0。

“许多已经存在很长时间的现有技术工具提供了一个部分,但未来,我们需要一个更全面的解决方案,而知识图方法在这方面发挥着重要作用,”他说。

Hodgson认为,不同级别的人员与公司的元数据有不同的关系。有些人正在使用数据治理。

“他们不只是收集元数据,他们想要做点什么 - 也许是它的血统,也许它是合规的,也许它正在弄清楚他们需要存档什么,他们需要存档多长时间。”

其他人正在收集元数据,有些小组正在与之互动,因为他们正在处理一个项目。“将所有这些结合在一起需要一种数据治理以前没有的方法论。”

知识图技术

知识图通常用于社交网络中,用于在线交易中的欺诈检测,以及作为推荐引擎。知识图表具有适应性,可重用性和增强性,将灵活性与结构和意义相结合。

使用知识图和图数据库的简单结构可以实现强大的企业级关联。镜像我们的思维方式,知识图使用一组节点,边和属性来表示和存储数据。数据点之间的关系通常比单个点本身更重要。

TopQuadrant将知识图定义为一组互连的信息,能够有意义地桥接企业数据孤岛,并通过关系提供组织的整体视图。

由于企业数据是企业最重要的资产之一,因此通过企业生态系统中所有资产的连接来捕获其全部的技术和业务环境,是有效数据治理的基础。最好的方法是通过开放,可扩展和智能的方法。Hodgson表示,实现这一目标的一个有效方法是通过Knowledge Graphs。

为什么知识图表很重要?

霍奇森概述了知识图为数据建模过程提供的四个关键能力:

  • 可扩展性:能够适应随时间演变的各种数据和元数据
  • 内省/查询能力:可以检查模型以找出可知和可查找的内容
  • 语义:数据的含义与数据一起存储在图表中以理解连接
  • 智能启用:推断对象之间的依赖关系和其他关系的能力

TopQuadrant

TopQuadrant的使命是使信息有意义,从而赋予人们权力。他们认为他们对语义Web标准的承诺是他们成功的关键部分。语义Web是当前Web的增强,其中含义(即语义)是机器可处理的。拥有使用计算机理解的词汇表的数据可以更轻松地查找,共享和组合数据/信息。

Polikoff表示,客户需求导致使用公认的语义标准管理词汇表,然后公司使用知识图谱技术扩展产品并管理所有类型的元数据:结构化,非结构化,业务,技术,操作等。“您需要拥有为了帮助在数据治理领域工作的人,某种程度的自动化,“她说,所以他们增加了有监督的机器学习,使”认知数据治理“成为可能。正如霍奇森所说,“数据治理是关于连接事物的,所以我们创建了一个利用知识图来建立全面关系的平台。”

TopBraid

TopBraid企业数据治理解决方案使用知识图,规则和受监督的机器学习来管理元数据并解决数据治理的所有三个方面:

  • 执行治理:创建控制,流程和策略,或者如果它们已经非正式存在则将其正式化
  • 代表性治理:创建要捕获的信息模型,例如词汇表,数据源,应用程序,参考数据等,并使用这些模型来描述这些资产
  • 应用治理:使用捕获的信息来满足特定需求。对某些人来说,可能是评估数据源变化影响的能力。对于其他人,它可能是为了追踪数据沿袭以满足法规遵从要求。另一个共同目标是提高数据的质量和一致性

霍奇森说他现在看到元数据孤岛面对需要跨越生态系统景观的人们“弄清楚什么在移动,它来自哪里,在哪里,以及它如何影响事物”,他将这种情况比作铁路系统。他认为该行业面临的最大问题是每个供应商都提供自己独特的模型。“我们有一个开放的架构模型。我们使用标准。这是人们开始意识到并欣赏的东西,“他说。

他在TopQuadrant担任首席技术官的职责是打破复杂性,找到为商务人士和技术人员提供有用体验的最佳方式。他看到对知识图(又称语义技术)以及数据治理可以提供的价值的兴奋日益增加。“人们不希望只有漂亮的照片。当他们进行数据治理时,他们希望确保它具有影响力。“


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 6个实施数据治理的最佳实践方法

    6个实施数据治理的最佳实践方法

    在寻找数据治理最佳实施方法时,您可以从已有的各种流程和模板工作的人那里学到很多东西。尽管每个企业都不同,您将需要根据流程调整数据治理实践……查看详情

    发布时间:2021.07.28来源:亿信数据治理知识库浏览量:209次

  • 什么是数据集成?

    什么是数据集成?

    数据集成是将来自不同来源的数据组合到统一视图中的过程:从摄取,清理,映射和转换到目标接收器,最后使数据对访问它的人更具可操作性和价值。 ……查看详情

    发布时间:2018.12.20来源:数据治理浏览量:121次

  • 数据建模和数据映射:来自任何数据的结果

    数据建模和数据映射:来自任何数据的结果

    统一的数据建模和数据映射方法可能是许多数据驱动型组织所需要的突破。在我与客户进行的大多数对话中,他们表示需要一个可行的解决方案来模拟他……查看详情

    发布时间:2019.01.17来源:亿信华辰浏览量:215次

  • 企业主数据管理方案

    企业主数据管理方案

    主数据管理使得企业能够集中化管理数据,在分散的系统间保证主数据的一致性,改进数据合规性、快速部署新应用、充分了解客户、加速推出新产品的速……查看详情

    发布时间:2020.04.29来源:知乎浏览量:152次

  • 通用数据治理平台的功能模块

    通用数据治理平台的功能模块

    随着互联网与大数据技术的飞速发展,大数据已经融入到了各行各业。数据治理非常重要,已经逐渐成为了政府、企业进行智能化决策的重要手段。数据治……查看详情

    发布时间:2022.02.23来源:浏览量:595次

  • 数据质量问题根因分析

    数据质量问题根因分析

    说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:275次

  • 企业数据交换共享平台整体解决方案

    企业数据交换共享平台整体解决方案

    以一个场景来说。某个企业想要筹建数据中心,用于将各业务系统数据接入,标准化处理后将数据公布给分析系统展示。项目周期比较短,那是否有现成的……查看详情

    发布时间:2020.04.23来源:知乎浏览量:197次

  • 大数据时代企业为什么需要数据治理吗?

    大数据时代企业为什么需要数据治理吗?

    如今数字化转型正在各行各业中迅速发展,以数据、流量、知识为主大数据时代已经到来,对于一个企业来说,要实施数字花和大数据战略,数据治理更为……查看详情

    发布时间:2019.07.18来源:知乎浏览量:146次

  • 医疗保健委员会治理的最佳实践是什么?

    医疗保健委员会治理的最佳实践是什么?

    治理这个词源于拉丁语gubernare,意思是指导或统治。医疗保健委员会的治理正在发展,因为技术使医院和其他医疗机构能够访问越来越多的数……查看详情

    发布时间:2019.03.14来源:亿信华辰浏览量:155次

  • 可以加强您的数据治理框架的五大方面

    可以加强您的数据治理框架的五大方面

    信息就是力量,您的组织每天都依靠它来做出明智的商业决策。不幸的是,组织产生的数据并没有按照应有的方式进行管理。大数据调查表明,业务和技术……查看详情

    发布时间:2019.07.04来源:知乎浏览量:181次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议