使用知识图技术实现数据治理2.0

发布时间:2019.02.21来源:亿信华辰浏览量:171次标签:数据治理

数据治理

Polikoff说,15到20年前,我们现在称之为数据治理的是企业架构。当时的目标是捕获有关企业数据处理的所有信息 - 这是一项昂贵且耗时的任务,Polikoff将其比作“沸腾海洋”.Coyne同意Polikoff并补充说,在试图记录所有存在的连接时,一小群非常技术性的人会用巨大的图表为一个房间壁纸。从这个过程来看,技术方面确实得到了一种理解,但对于商业用户而言,它太复杂且无法获取。

通过限制数据存储和应用程序的大小和数量来使这项任务更易于管理的努力随着时间的推移不成功,因为在很短的时间内,最多几年,在每次“合理化”努力之后,公司最终将获得两倍的成本Polikoff说,数据就像他们开始时一样。“这只是业务的本质。”

由于数据存储和来源的激增以及处理的复杂性日益增加,数据管理的需求从数据管理的角度慢慢出现。她说,了解数据的背景变得更加重要。

“如果你试图描述你的数据以便更好地管理它,你必须从它的使用方式来描述它。捕获围绕数据创建和使用的上下文是必要的,而这基本上就是企业架构。“

与支持事务处理的典型操作系统不同,数据治理系统是关于跨数字环境的连接,因此必须拥有一个能够灵活地,逐步建立对不同利益相关者有意义的连接的平台,她说。“现在我们看到企业数据治理空间必须是一个基本的业务驱动的活动,而不是IT驱动的活动,”Coyne补充说。

霍奇森表示,要依赖元数据进行上下文,就需要对正在发生的事情保持忠诚度或“敏锐度”。“所以你不要只抓取一次元数据,你要继续检查元数据是否应该是这样的。”使用数据架构,一旦建立模型并且“壁纸”启动,企业就会发生变化。图表已过时。“改变是重新构建数据治理而不是数据架构的关键驱动因素,”他说。

Coyne表示,数据治理旨在提供从业务到最技术元素的数据生命周期的全面视图。人们有时会认为他们拥有有效的数据治理,因为他们只拥有整个生命周期的一小部分。但是,整个数据生态系统中更具连接性,全面的生命周期能力是当今世界所需要的,以实现他所谓的数据治理2.0。

“许多已经存在很长时间的现有技术工具提供了一个部分,但未来,我们需要一个更全面的解决方案,而知识图方法在这方面发挥着重要作用,”他说。

Hodgson认为,不同级别的人员与公司的元数据有不同的关系。有些人正在使用数据治理。

“他们不只是收集元数据,他们想要做点什么 - 也许是它的血统,也许它是合规的,也许它正在弄清楚他们需要存档什么,他们需要存档多长时间。”

其他人正在收集元数据,有些小组正在与之互动,因为他们正在处理一个项目。“将所有这些结合在一起需要一种数据治理以前没有的方法论。”

知识图技术

知识图通常用于社交网络中,用于在线交易中的欺诈检测,以及作为推荐引擎。知识图表具有适应性,可重用性和增强性,将灵活性与结构和意义相结合。

使用知识图和图数据库的简单结构可以实现强大的企业级关联。镜像我们的思维方式,知识图使用一组节点,边和属性来表示和存储数据。数据点之间的关系通常比单个点本身更重要。

TopQuadrant将知识图定义为一组互连的信息,能够有意义地桥接企业数据孤岛,并通过关系提供组织的整体视图。

由于企业数据是企业最重要的资产之一,因此通过企业生态系统中所有资产的连接来捕获其全部的技术和业务环境,是有效数据治理的基础。最好的方法是通过开放,可扩展和智能的方法。Hodgson表示,实现这一目标的一个有效方法是通过Knowledge Graphs。

为什么知识图表很重要?

霍奇森概述了知识图为数据建模过程提供的四个关键能力:

  • 可扩展性:能够适应随时间演变的各种数据和元数据
  • 内省/查询能力:可以检查模型以找出可知和可查找的内容
  • 语义:数据的含义与数据一起存储在图表中以理解连接
  • 智能启用:推断对象之间的依赖关系和其他关系的能力

TopQuadrant

TopQuadrant的使命是使信息有意义,从而赋予人们权力。他们认为他们对语义Web标准的承诺是他们成功的关键部分。语义Web是当前Web的增强,其中含义(即语义)是机器可处理的。拥有使用计算机理解的词汇表的数据可以更轻松地查找,共享和组合数据/信息。

Polikoff表示,客户需求导致使用公认的语义标准管理词汇表,然后公司使用知识图谱技术扩展产品并管理所有类型的元数据:结构化,非结构化,业务,技术,操作等。“您需要拥有为了帮助在数据治理领域工作的人,某种程度的自动化,“她说,所以他们增加了有监督的机器学习,使”认知数据治理“成为可能。正如霍奇森所说,“数据治理是关于连接事物的,所以我们创建了一个利用知识图来建立全面关系的平台。”

TopBraid

TopBraid企业数据治理解决方案使用知识图,规则和受监督的机器学习来管理元数据并解决数据治理的所有三个方面:

  • 执行治理:创建控制,流程和策略,或者如果它们已经非正式存在则将其正式化
  • 代表性治理:创建要捕获的信息模型,例如词汇表,数据源,应用程序,参考数据等,并使用这些模型来描述这些资产
  • 应用治理:使用捕获的信息来满足特定需求。对某些人来说,可能是评估数据源变化影响的能力。对于其他人,它可能是为了追踪数据沿袭以满足法规遵从要求。另一个共同目标是提高数据的质量和一致性

霍奇森说他现在看到元数据孤岛面对需要跨越生态系统景观的人们“弄清楚什么在移动,它来自哪里,在哪里,以及它如何影响事物”,他将这种情况比作铁路系统。他认为该行业面临的最大问题是每个供应商都提供自己独特的模型。“我们有一个开放的架构模型。我们使用标准。这是人们开始意识到并欣赏的东西,“他说。

他在TopQuadrant担任首席技术官的职责是打破复杂性,找到为商务人士和技术人员提供有用体验的最佳方式。他看到对知识图(又称语义技术)以及数据治理可以提供的价值的兴奋日益增加。“人们不希望只有漂亮的照片。当他们进行数据治理时,他们希望确保它具有影响力。“


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 为什么你应该有一个数据治理策略

    为什么你应该有一个数据治理策略

    垃圾进垃圾出。自打孔卡和电传终端以来,这个座右铭一直是真实的。如今,复杂的IT系统同样依赖于高质量的数据,无论是在会计,生产还是商业智能……查看详情

    发布时间:2018.11.22来源:数据治理浏览量:201次

  • 数据质量监控步骤及方法

    数据质量监控步骤及方法

    随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖……查看详情

    发布时间:2020.08.31来源:CSDN浏览量:383次

  • 银行数据治理-数据治理是银行业面对的一个崭新课题

    银行数据治理-数据治理是银行业面对的一个崭新课题

    本书是“银行业信息化丛书”之一,数据治理是银行业面对的一个崭新课题,本书从银行业数据基本概况、数据治理现状,以及银行业数据治理体系、数据……查看详情

    发布时间:2018.11.29来源:数据治理浏览量:192次

  • 数据治理的坑你遇到过几个?

    数据治理的坑你遇到过几个?

    数据治理是一项长期而繁杂的工作,很多时候大家都为如何做好数据治理而感到困惑,甚至很多时候对此失去了信心。……查看详情

    发布时间:2019.08.19来源:御数坊浏览量:184次

  • 如何做好数据治理工作-数据治理之“术”

    如何做好数据治理工作-数据治理之“术”

    数据治理是一项长期、复杂的系统工程,要在组织、机制和标准等方面加强统筹谋划。……查看详情

    发布时间:2020.01.03来源:知乎浏览量:177次

  • 数据生命周期管理工作包括哪些方面

    数据生命周期管理工作包括哪些方面

    睿治数据治理工具--数据生命周期管理平台支持数据资产全生命周期管理,根据存储周期自动计算每行数据的存储时限,并根据存储时限进行数据自动归……查看详情

    发布时间:2021.09.02来源:亿信华辰数据治理知识库浏览量:661次

  • 浅谈数据质量管理

    浅谈数据质量管理

    随着互联网及数字化技术的飞速发展,我们生活在一个数字化转型的时代,各种数字化正在实实在在的改变着企业的日常运营,以及我们每个人的衣食住行……查看详情

    发布时间:2019.07.26来源:知乎浏览量:189次

  • 使我们的国家数据资源现代化:永无止境的挑战

    使我们的国家数据资源现代化:永无止境的挑战

    澳大利亚统计局,包括其前身组织,已经为澳大利亚社区提供了超过110年的优质可靠数据。……查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:151次

  • 数据治理&数据仓库

    数据治理&数据仓库

    亿信睿智数据治理管理平台提供数据治理&数据仓库一体化解决方案,协助企业:建立企业内一致的信息视图,建立操作型数据的集中存储与分发的基础平……查看详情

    发布时间:2018.12.05来源:数据治理浏览量:275次

  • 什么是元数据管理框架?元数据管理框架如何制定?

    什么是元数据管理框架?元数据管理框架如何制定?

    元数据管理框架描述了一种使数据和元数据资产更易于访问和用于实现业务目标的组织方法。它根据组织的需求,动员并扩展了作为元数据管理基础的现有……查看详情

    发布时间:2021.07.16来源:亿信数据治理知识库浏览量:173次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议