使用知识图技术实现数据治理2.0

发布时间:2019.02.21来源:亿信华辰浏览量:157次标签:数据治理

数据治理

Polikoff说,15到20年前,我们现在称之为数据治理的是企业架构。当时的目标是捕获有关企业数据处理的所有信息 - 这是一项昂贵且耗时的任务,Polikoff将其比作“沸腾海洋”.Coyne同意Polikoff并补充说,在试图记录所有存在的连接时,一小群非常技术性的人会用巨大的图表为一个房间壁纸。从这个过程来看,技术方面确实得到了一种理解,但对于商业用户而言,它太复杂且无法获取。

通过限制数据存储和应用程序的大小和数量来使这项任务更易于管理的努力随着时间的推移不成功,因为在很短的时间内,最多几年,在每次“合理化”努力之后,公司最终将获得两倍的成本Polikoff说,数据就像他们开始时一样。“这只是业务的本质。”

由于数据存储和来源的激增以及处理的复杂性日益增加,数据管理的需求从数据管理的角度慢慢出现。她说,了解数据的背景变得更加重要。

“如果你试图描述你的数据以便更好地管理它,你必须从它的使用方式来描述它。捕获围绕数据创建和使用的上下文是必要的,而这基本上就是企业架构。“

与支持事务处理的典型操作系统不同,数据治理系统是关于跨数字环境的连接,因此必须拥有一个能够灵活地,逐步建立对不同利益相关者有意义的连接的平台,她说。“现在我们看到企业数据治理空间必须是一个基本的业务驱动的活动,而不是IT驱动的活动,”Coyne补充说。

霍奇森表示,要依赖元数据进行上下文,就需要对正在发生的事情保持忠诚度或“敏锐度”。“所以你不要只抓取一次元数据,你要继续检查元数据是否应该是这样的。”使用数据架构,一旦建立模型并且“壁纸”启动,企业就会发生变化。图表已过时。“改变是重新构建数据治理而不是数据架构的关键驱动因素,”他说。

Coyne表示,数据治理旨在提供从业务到最技术元素的数据生命周期的全面视图。人们有时会认为他们拥有有效的数据治理,因为他们只拥有整个生命周期的一小部分。但是,整个数据生态系统中更具连接性,全面的生命周期能力是当今世界所需要的,以实现他所谓的数据治理2.0。

“许多已经存在很长时间的现有技术工具提供了一个部分,但未来,我们需要一个更全面的解决方案,而知识图方法在这方面发挥着重要作用,”他说。

Hodgson认为,不同级别的人员与公司的元数据有不同的关系。有些人正在使用数据治理。

“他们不只是收集元数据,他们想要做点什么 - 也许是它的血统,也许它是合规的,也许它正在弄清楚他们需要存档什么,他们需要存档多长时间。”

其他人正在收集元数据,有些小组正在与之互动,因为他们正在处理一个项目。“将所有这些结合在一起需要一种数据治理以前没有的方法论。”

知识图技术

知识图通常用于社交网络中,用于在线交易中的欺诈检测,以及作为推荐引擎。知识图表具有适应性,可重用性和增强性,将灵活性与结构和意义相结合。

使用知识图和图数据库的简单结构可以实现强大的企业级关联。镜像我们的思维方式,知识图使用一组节点,边和属性来表示和存储数据。数据点之间的关系通常比单个点本身更重要。

TopQuadrant将知识图定义为一组互连的信息,能够有意义地桥接企业数据孤岛,并通过关系提供组织的整体视图。

由于企业数据是企业最重要的资产之一,因此通过企业生态系统中所有资产的连接来捕获其全部的技术和业务环境,是有效数据治理的基础。最好的方法是通过开放,可扩展和智能的方法。Hodgson表示,实现这一目标的一个有效方法是通过Knowledge Graphs。

为什么知识图表很重要?

霍奇森概述了知识图为数据建模过程提供的四个关键能力:

  • 可扩展性:能够适应随时间演变的各种数据和元数据
  • 内省/查询能力:可以检查模型以找出可知和可查找的内容
  • 语义:数据的含义与数据一起存储在图表中以理解连接
  • 智能启用:推断对象之间的依赖关系和其他关系的能力

TopQuadrant

TopQuadrant的使命是使信息有意义,从而赋予人们权力。他们认为他们对语义Web标准的承诺是他们成功的关键部分。语义Web是当前Web的增强,其中含义(即语义)是机器可处理的。拥有使用计算机理解的词汇表的数据可以更轻松地查找,共享和组合数据/信息。

Polikoff表示,客户需求导致使用公认的语义标准管理词汇表,然后公司使用知识图谱技术扩展产品并管理所有类型的元数据:结构化,非结构化,业务,技术,操作等。“您需要拥有为了帮助在数据治理领域工作的人,某种程度的自动化,“她说,所以他们增加了有监督的机器学习,使”认知数据治理“成为可能。正如霍奇森所说,“数据治理是关于连接事物的,所以我们创建了一个利用知识图来建立全面关系的平台。”

TopBraid

TopBraid企业数据治理解决方案使用知识图,规则和受监督的机器学习来管理元数据并解决数据治理的所有三个方面:

  • 执行治理:创建控制,流程和策略,或者如果它们已经非正式存在则将其正式化
  • 代表性治理:创建要捕获的信息模型,例如词汇表,数据源,应用程序,参考数据等,并使用这些模型来描述这些资产
  • 应用治理:使用捕获的信息来满足特定需求。对某些人来说,可能是评估数据源变化影响的能力。对于其他人,它可能是为了追踪数据沿袭以满足法规遵从要求。另一个共同目标是提高数据的质量和一致性

霍奇森说他现在看到元数据孤岛面对需要跨越生态系统景观的人们“弄清楚什么在移动,它来自哪里,在哪里,以及它如何影响事物”,他将这种情况比作铁路系统。他认为该行业面临的最大问题是每个供应商都提供自己独特的模型。“我们有一个开放的架构模型。我们使用标准。这是人们开始意识到并欣赏的东西,“他说。

他在TopQuadrant担任首席技术官的职责是打破复杂性,找到为商务人士和技术人员提供有用体验的最佳方式。他看到对知识图(又称语义技术)以及数据治理可以提供的价值的兴奋日益增加。“人们不希望只有漂亮的照片。当他们进行数据治理时,他们希望确保它具有影响力。“


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 银行数据治理-数据治理是银行业面对的一个崭新课题

    银行数据治理-数据治理是银行业面对的一个崭新课题

    本书是“银行业信息化丛书”之一,数据治理是银行业面对的一个崭新课题,本书从银行业数据基本概况、数据治理现状,以及银行业数据治理体系、数据……查看详情

    发布时间:2018.11.29来源:数据治理浏览量:171次

  • 目前国内外主流的主数据管理平台

    目前国内外主流的主数据管理平台

    企业主数据(Master Data)是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值……查看详情

    发布时间:2020.04.29来源:知乎浏览量:139次

  • 数据治理研究述评

    数据治理研究述评

    数据治理是数据科学时代关注的研究课题,对数据治理的概念、体系、内容和应用的相关研究进行述评,以期将数据治理研究引向深入。……查看详情

    发布时间:2019.08.27来源:南京大学信息管理学院浏览量:231次

  • 如何正确理解数据治理

    如何正确理解数据治理

    我们经常会谈到关于大数据、数据质量、主数据、元数据方面的一些问题,不可避免的会提到数据治理,那么什么是数据治理呢?……查看详情

    发布时间:2020.07.15来源:知乎浏览量:139次

  • 数据治理的坑你遇到过几个?

    数据治理的坑你遇到过几个?

    数据治理是一项长期而繁杂的工作,很多时候大家都为如何做好数据治理而感到困惑,甚至很多时候对此失去了信心。……查看详情

    发布时间:2019.08.19来源:御数坊浏览量:166次

  • 数据治理如何支持数据隐私合规性

    数据治理如何支持数据隐私合规性

    已经具备数据治理功能的组织具有坚实的领先优势,可以利用它来促进数据隐私合规性的许多方面。……查看详情

    发布时间:2019.02.15来源:CIO浏览量:137次

  • 数据治理:医院要平衡的4个考虑因素

    数据治理:医院要平衡的4个考虑因素

    电子健康倡议基金会,一个专注于质量和安全改进的医疗保健合作,以及LexisNexis Risk Solutions的医疗保健部门,于8月……查看详情

    发布时间:2018.11.27来源:Jessica Kim Cohen浏览量:110次

  • 您是将数据视为资产吗?

    您是将数据视为资产吗?

    您可以做的最好的事情是鼓励以数据为中心的文化,实现安全和隐私的重要性,以及了解数据对您组织的成功至关重要。 这是我们不断听到的一句话,……查看详情

    发布时间:2018.12.28来源:数据治理浏览量:117次

  • 即使是善意的数据治理策略失败的3个原因

    即使是善意的数据治理策略失败的3个原因

    也许你曾经遇到过这种情况。您打算在您的工作地点创建一个新的数据治理计划。你做你的研究,通知所有必要的团队,建立一个水密的时间表和预算,在……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:115次

  • 4种启动数据治理计划的数据治理最佳实践

    4种启动数据治理计划的数据治理最佳实践

    对于数据治理而言,不同行业和地理位置的巨大景观聚集在一起,为有效管理数据创造了重要且可持续的东西。……查看详情

    发布时间:2018.12.25来源:亿信华辰浏览量:148次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议