使用知识图技术实现数据治理2.0

发布时间:2019.02.21来源:亿信华辰浏览量:135次标签:数据治理

数据治理

Polikoff说,15到20年前,我们现在称之为数据治理的是企业架构。当时的目标是捕获有关企业数据处理的所有信息 - 这是一项昂贵且耗时的任务,Polikoff将其比作“沸腾海洋”.Coyne同意Polikoff并补充说,在试图记录所有存在的连接时,一小群非常技术性的人会用巨大的图表为一个房间壁纸。从这个过程来看,技术方面确实得到了一种理解,但对于商业用户而言,它太复杂且无法获取。

通过限制数据存储和应用程序的大小和数量来使这项任务更易于管理的努力随着时间的推移不成功,因为在很短的时间内,最多几年,在每次“合理化”努力之后,公司最终将获得两倍的成本Polikoff说,数据就像他们开始时一样。“这只是业务的本质。”

由于数据存储和来源的激增以及处理的复杂性日益增加,数据管理的需求从数据管理的角度慢慢出现。她说,了解数据的背景变得更加重要。

“如果你试图描述你的数据以便更好地管理它,你必须从它的使用方式来描述它。捕获围绕数据创建和使用的上下文是必要的,而这基本上就是企业架构。“

与支持事务处理的典型操作系统不同,数据治理系统是关于跨数字环境的连接,因此必须拥有一个能够灵活地,逐步建立对不同利益相关者有意义的连接的平台,她说。“现在我们看到企业数据治理空间必须是一个基本的业务驱动的活动,而不是IT驱动的活动,”Coyne补充说。

霍奇森表示,要依赖元数据进行上下文,就需要对正在发生的事情保持忠诚度或“敏锐度”。“所以你不要只抓取一次元数据,你要继续检查元数据是否应该是这样的。”使用数据架构,一旦建立模型并且“壁纸”启动,企业就会发生变化。图表已过时。“改变是重新构建数据治理而不是数据架构的关键驱动因素,”他说。

Coyne表示,数据治理旨在提供从业务到最技术元素的数据生命周期的全面视图。人们有时会认为他们拥有有效的数据治理,因为他们只拥有整个生命周期的一小部分。但是,整个数据生态系统中更具连接性,全面的生命周期能力是当今世界所需要的,以实现他所谓的数据治理2.0。

“许多已经存在很长时间的现有技术工具提供了一个部分,但未来,我们需要一个更全面的解决方案,而知识图方法在这方面发挥着重要作用,”他说。

Hodgson认为,不同级别的人员与公司的元数据有不同的关系。有些人正在使用数据治理。

“他们不只是收集元数据,他们想要做点什么 - 也许是它的血统,也许它是合规的,也许它正在弄清楚他们需要存档什么,他们需要存档多长时间。”

其他人正在收集元数据,有些小组正在与之互动,因为他们正在处理一个项目。“将所有这些结合在一起需要一种数据治理以前没有的方法论。”

知识图技术

知识图通常用于社交网络中,用于在线交易中的欺诈检测,以及作为推荐引擎。知识图表具有适应性,可重用性和增强性,将灵活性与结构和意义相结合。

使用知识图和图数据库的简单结构可以实现强大的企业级关联。镜像我们的思维方式,知识图使用一组节点,边和属性来表示和存储数据。数据点之间的关系通常比单个点本身更重要。

TopQuadrant将知识图定义为一组互连的信息,能够有意义地桥接企业数据孤岛,并通过关系提供组织的整体视图。

由于企业数据是企业最重要的资产之一,因此通过企业生态系统中所有资产的连接来捕获其全部的技术和业务环境,是有效数据治理的基础。最好的方法是通过开放,可扩展和智能的方法。Hodgson表示,实现这一目标的一个有效方法是通过Knowledge Graphs。

为什么知识图表很重要?

霍奇森概述了知识图为数据建模过程提供的四个关键能力:

  • 可扩展性:能够适应随时间演变的各种数据和元数据
  • 内省/查询能力:可以检查模型以找出可知和可查找的内容
  • 语义:数据的含义与数据一起存储在图表中以理解连接
  • 智能启用:推断对象之间的依赖关系和其他关系的能力

TopQuadrant

TopQuadrant的使命是使信息有意义,从而赋予人们权力。他们认为他们对语义Web标准的承诺是他们成功的关键部分。语义Web是当前Web的增强,其中含义(即语义)是机器可处理的。拥有使用计算机理解的词汇表的数据可以更轻松地查找,共享和组合数据/信息。

Polikoff表示,客户需求导致使用公认的语义标准管理词汇表,然后公司使用知识图谱技术扩展产品并管理所有类型的元数据:结构化,非结构化,业务,技术,操作等。“您需要拥有为了帮助在数据治理领域工作的人,某种程度的自动化,“她说,所以他们增加了有监督的机器学习,使”认知数据治理“成为可能。正如霍奇森所说,“数据治理是关于连接事物的,所以我们创建了一个利用知识图来建立全面关系的平台。”

TopBraid

TopBraid企业数据治理解决方案使用知识图,规则和受监督的机器学习来管理元数据并解决数据治理的所有三个方面:

  • 执行治理:创建控制,流程和策略,或者如果它们已经非正式存在则将其正式化
  • 代表性治理:创建要捕获的信息模型,例如词汇表,数据源,应用程序,参考数据等,并使用这些模型来描述这些资产
  • 应用治理:使用捕获的信息来满足特定需求。对某些人来说,可能是评估数据源变化影响的能力。对于其他人,它可能是为了追踪数据沿袭以满足法规遵从要求。另一个共同目标是提高数据的质量和一致性

霍奇森说他现在看到元数据孤岛面对需要跨越生态系统景观的人们“弄清楚什么在移动,它来自哪里,在哪里,以及它如何影响事物”,他将这种情况比作铁路系统。他认为该行业面临的最大问题是每个供应商都提供自己独特的模型。“我们有一个开放的架构模型。我们使用标准。这是人们开始意识到并欣赏的东西,“他说。

他在TopQuadrant担任首席技术官的职责是打破复杂性,找到为商务人士和技术人员提供有用体验的最佳方式。他看到对知识图(又称语义技术)以及数据治理可以提供的价值的兴奋日益增加。“人们不希望只有漂亮的照片。当他们进行数据治理时,他们希望确保它具有影响力。“


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业的主数据管理——亿信华辰

    企业的主数据管理——亿信华辰

    企业主数据指企业内一致并共享的业务主体。主数据管理,包括不仅仅是硬件和软件,还是将数据作为重要资产管理的思想和办法,是指一整套的用于生成……查看详情

    发布时间:2019.03.05来源:数据管理浏览量:115次

  • 数据科学趋势在2019年

    数据科学趋势在2019年

    在谈到2019年要关注的主要数据科学趋势时,Kaggle的联合创始人兼首席执行官Anthony Goldbloom 预测,很快数据中心将……查看详情

    发布时间:2019.01.04来源:数据治理浏览量:84次

  • 新的独立全球分析师研究强调数据治理挑战

    新的独立全球分析师研究强调数据治理挑战

    佛罗里达州奥兰多,10月14日-交付 分析的未来,Pentaho的,一个日立数据系统公司今天宣布,由Forrester咨询公司进行的2……查看详情

    发布时间:2019.03.05来源:亿信华辰浏览量:119次

  • 主动方法在数据治理的数据架构

    主动方法在数据治理的数据架构

    “数据架构是业务战略的物理实现,” 全球数据战略有限公司 EMEA首席顾问NigelTurner在DATAVER……查看详情

    发布时间:2019.01.16来源:亿信华辰浏览量:94次

  • 在抗灾中积累治理“大数据”

    在抗灾中积累治理“大数据”

    每一次应对灾害,无论是经验还是教训,都会构成全国其他地方“诊治”灾害的“大数据”参考……查看详情

    发布时间:2018.09.25来源:人民日报浏览量:84次

  • 治理和管理

    治理和管理

    以问责制为重点的数据管理定义是“确保数据相关工作根据通过治理建立的政策和实践来执行的一系列活动。”……查看详情

    发布时间:2019.03.18来源:亿信华辰浏览量:118次

  • 数据质量问题根因分析

    数据质量问题根因分析

    说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:174次

  • 解决方案中的简单性:迈向身份治理的步骤

    解决方案中的简单性:迈向身份治理的步骤

    面对颠覆性变革,只有在新设备和平台上线时才会加深,并且随着物联网投放更多数据,身份治理至关重要。企业现在通过自己的部署和合作伙伴关系来管……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:102次

  • 主数据管理第二步——体系构建

    主数据管理第二步——体系构建

    “纸上得来终觉浅,绝知此事要躬行。”然而主数据管理工作该怎么做?流程是怎样的?责任如何落实?……这些问题无不与主数据管理体系的构建有着密……查看详情

    发布时间:2019.10.24来源:亿信华辰浏览量:114次

  • 一张架构图告诉你数据中台如何搭建

    一张架构图告诉你数据中台如何搭建

    当下,刮起了一场数据中台风,立马席卷了大数据行业的各个角落。人人都在谈什么是数据中台,我们需不需要建数据中台,数据中台要怎么建?今天,小……查看详情

    发布时间:2020.10.15来源:数据中台浏览量:111次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议