数据虚拟化 实现大数据的有效管理

发布时间:2019.03.05来源:亿信华辰浏览量:104次标签:数据治理

数据管理

关于在石油天然气的钻探和出产过程中所发生的数据的价值,并没有太多的争议。尽管数字化油田运动的最初意图,是将与设备的监测和维护相关的使命完结自动化,以下降本钱,但它还带来了许多其它的优点。
 

许多职业专家以为,最首要的收益在于:向石油天然气出产制造商展示,假如办理恰当的话,怎么搜集数据才干取得更多有战略含义的数据,而不仅仅是通知油井运转人员,什么时候需求修理或更换老化的设备。
 
实际上,职业界有越来越多的人以为,分布在油田、气田各地的传感器和其它自动化装置所发生的数据,应被视为财物,应该像对该公司最贵重的出产设备或最聪明的工程师相同对待这些数据。
 
高级数字化油田参谋Philippe Flichy就持有这样的观念。他将在石油和天然气钻探和出产过程中所发生的数据,称为“会说话的财物”,他以为这些数据的价值直接取决于怎么办理这些数据。他任职于美国一家为全球石油开发和加工工业供给产品和效劳的大型油田技能效劳公司Baker Hughes。
 
在最近提交给美国石油工程师协会的一篇论文中,Flichy供给了依据来支撑这种观念。论文的题目为《可信数据作为公司财物》,文中征引一项研讨数据标明:假如能够有效的办理数据,石油天然气公司的全体利润能够增厚高达6%。它还在文中提到了壳牌石油公司,指出该公司从多个途径受益于有效的数据办理,包含油井提前投产以及超越预期的出产才能等。
 
尽管这些数据和分析给人留下了深刻的印象,可是依然有例外,由于许多石油天然气制造商在有效的数据办理方面,落后于其它职业。随着大量的信息涌入到日常运营中,许多石油天然气制造商,开始意识到之前是被迫的应对所谓的“大数据”的,现在,它们需求先进的东西来助其应对这些应战。
 
有效数据办理的捷径
 
正如一般所做的,技能供货商现已对这种境况给出了新的解决计划。其间最有期望的是被称之为数据虚拟化的计划,它是一种简化缔造基础设备的办法,以便将大数据转化为有用的信息,并根据这些信息做出正确的事务决议计划。
 
缔造这样的基础设备,需求将整个企业界发生的数据集成起来,使其至少从表面上看起来好像保存在某个中心地址。一旦缔造完结,基础设备就能够为用户(不管他们在企业界的职位、或位置怎么)供给快捷、便利的数据接入,以便在任何给定的时刻,只需作业需求,就可取得这些数据。
 
据Bloor Research公司的研讨总监Phillip Howard介绍,假如需求将多个数据源的数据整合到单一数据渠道,历史上公司有4种计划可供挑选。
 
这些选项包含:
 
●客户集成,包含在需求同享信息的运用之间建立硬编码;
 
●企业运用集成,需求为运用缔造企业效劳总线,创立连接器(一般也是运用硬编码),以便将信息经过总线在彼此之间传递;
 
●数据仿制,或创立多个数据备份,并将其安置在便于拜访的地址;
 
●抽取、传输、装载,将在单个运用中发生的数据总结出来的信息,安置在某一会集数据库中,这样就可供大量用户拜访。
 
上面每一个选项,都是一项杂乱—因而也就是贵重和费时—的使命,这就是为什么除了最大的石油天然气公司之外,大多数公司并没有布置实施的原因。最近几年,即使是大型的出产制造商也现已不再沉迷这些挑选,由于它们中的任何一个都不能供给一种特别有效的挑选大数据的办法。
 
Gartner公司的副总裁Douglas Laney于2001年在一篇介绍大数据的概念论文中提出,商业数据的“3个V”——数据量、速度和品种,正在推进公司去寻觅一种全新的数据办理办法。Laney指出,“电子商务的迸发、并购活动的添加、协作的扩大、以及将信息作为竞争的催化剂,这一切都在推进着企业的高层考虑怎么办理数据。”
 
随着大多数公司发生的数据量正在以指数办法添加,数据办理问题的状况变得愈加严峻。石油和天然气公司看到数据的品种现已扩展到包含来自于数字化油田和各种方式的非结构化数据,比方桌面运用发生的文件、电邮、社交媒体帖子以及影音文件等。
 
状况变化如此巨大,以至于Flichy在2015年发布论文时,改用了“数据的7个V”——添加了可变性、精确性、虚拟化和价值。
 
数据必须是牢靠的
 
在这7个V中,精确是最重要的,由于它涉及到数据的精度。不准确的数据不能被信赖,由于从决议计划拟定东西的角度来讲,没有任何含义。“在石油天然气职业,咱们遇到的最大问题是,人们并不相信数据源,”Flichy说道。“所以他们倾向于自己做。他们从不同的地方找到数据,然后将其整合在一起自己作分析。咱们经常听到人们在评论,工程师要花去大部分时刻来寻觅数据;他们实际上是将时刻花在匹配数据上面了。”
 
为了终止这种循环,Flichy说,“你必须创立仅有的真相,你必须经常这么做,只有人们对数据足够相信时,在运用这些数据作决议计划时才干充满信心。”
 
数据集成被以为是能够供给可信数据的重要来源。可是,很少有石油天然气公司能够付得起这种时刻长、价格高的数据集成工程,尤其是在公司必须办理的数据量急剧添加而石油天然气价格不断下降的时候。这就是为什么比如数据虚拟化的技能大受欢迎的原因。
 
“在4年前,我在Baker Hughes公司作业时,就开始了数据虚拟化工程,” Flichy说,“现在看来,效果显著。”
 
Baker Hughes公司创立了自己的数据虚拟化渠道,并将其命名为“Baker Hughes信息库。”最初,该渠道首要用于确保一切部门能够拜访绝对相同的数据,后来,该渠道现已演化为用于提高功率的东西。根据Flichy的介绍,在渠道的一切运用中,有一个就是对从分布在同一个油田或运转在相似条件下的不同油井取得的数据进行分析。这些分析所带来的成果就是为提高效益低下的油井产出而开发出来的新策略。“咱们是虚拟化的最大支撑者。”Flichy说道。“它将咱们的事务智能化提高到一个新的水平。”
 
减轻数据集成的难度Forrester Research公司将数据虚拟化比作为数据缔造一个面向效劳的架构(SOA)。“传统的SOA办法着力于事务流程,数据虚拟化则将重点放在事务过程所运用的那些数据。”Forrester的分析师Noel Yuhanna说道,“经过把数据从运用平分离开来,并将其存储在中间层,虚拟化很有或许会下降数据集成的困难。”
 
现在,许多技能供货商能够供给数据虚拟化渠道,包含中间层,以及在安排和过滤数据的过程中能够供给帮助的扩展运用。尽管这些渠道的组织随着供货商的不同而有所差异,但它们的终究意图是一致的:从多个数据源中提取各种不同的数据,将其集成到虚拟地址,并以一致、便于拜访的方式展现给用户。
 
布置虚拟数据渠道,能够消除在办理数据过程中大量杂乱的问题,由于该办法能够将数据保留在原始体系中。当用户拜访数据时(一般是经过某种方式的仪表盘或门户),它们经过一系列的指令来请求信息,实际上是经过搜索遍及企业不同区域的各个数据库或资源库,来获取数据位并将其组合在一起,形成对客户查询的呼应。
 
Moray Laing,是事务智能软件供货商SAS有限公司能源职业的咨询师,他也以为数据虚拟化大大下降了数据集成相关的费用,可是他一起也提醒,不能简略的将其视为开发和维护单一可信数据数据源所必须的数据办理的代替计划。
 
“经过主数据办理来维持数据的质量,是保证单一版别数据的现实办法。”Laing说道。“但是,咱们意识到某些主数据办理步骤,比方创立数据仓库,或许需求数年才干完结。数据虚拟化则供给了这种才能,能够顺利的将多个数据源和多种方式的数据集成到单一拜访点,使数据工程师能够减少许多繁重的作业。”
 
建立数据办理员的必要假如想要确保流入到虚拟渠道的数据都具有较好的质量,Flichy以为所需求履行的策略就是在数据源头对数据进行验证。“一旦在源头完结数据验证,那你就能够断定的通知用户,‘这些数据和进入到体系的原始数据是相同的。’然后,假如数据以任何方式移动或修正,那就必须在数据源头对其进行从头验证。”
 
在这种办法中,Flichy主张应该创立一个类似于“数据办理员”的职位。该职位的责任就是担任确保一切的数据,从输入到虚拟渠道前保持不变。
 
Flichy将数据办理员比作博物馆中处理碎片的职工。“他们知道哪些碎片具有最大的价值。”他说到,“关于数据,意识到它的价值,仅仅第一步。第二步就是花更多的精力发现最有价值的部分。假如最有价值的数据呈现退化的痕迹,那必须当即采取办法对其进行修复。”
 
数据虚拟化和数字化油田
 
根据Flichy的说法,石油天然气工业的特性使其成为最理想的扩展数据虚拟化运用以及尝试设置数据办理员岗位的最佳场所。
 
他以为,在石油天然气职业或许比其它任何职业,都更依赖于大量广泛分布的数据。石油和天然气公司也经常为其新油田或工厂设备,装备不同供货商的设备和技能,而它们的产品并不总是易于集成。
 
“尽管职业正在阅历着衰退,但这也从一方面推进着企业想要取得更高功率。”Flichy说。“怎么取得更高的功率?仅仅求助于分析,可是假如不信赖那些数据,那分析也无能为力。”虚拟化则有期望供给一种比传统办法更快、更低本钱的途径来取得可信的数据。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 什么是数据治理以及数据治理架构

    什么是数据治理以及数据治理架构

    数据治理(DataGovernance),是企业数据治理部门发起并推行的,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的……查看详情

    发布时间:2018.12.06来源:数据治理浏览量:94次

  • 数据治理需要什么?

    数据治理需要什么?

    数据治理是关于启用和鼓励有关数据的良好行为,以及限制产生风险的行为。……查看详情

    发布时间:2019.03.20来源:亿信华辰浏览量:85次

  • 数据治理全域解决方案来了:对症下药 各个击破

    数据治理全域解决方案来了:对症下药 各个击破

    如今数据治理作为数字化转型的基础,成为了数字化变革中的焦点和主战场。不少小伙伴向小亿诉苦,“到底该如何着手做数据治理,能不能先做元数据管……查看详情

    发布时间:2022.01.22来源:小亿浏览量:741次

  • 以数据中台为切入点,场景/应用驱动源头数据治理

    以数据中台为切入点,场景/应用驱动源头数据治理

    数据中台通常是应用驱动构建,所处理的数据是业务关心和使用的数据。在数据中台开发与运营服务的过程中,面临很多源头数据的问题,比如不同系统的……查看详情

    发布时间:2020.04.01来源:知乎浏览量:96次

  • 数据治理的四个阶段

    数据治理的四个阶段

    数据治理的定义是对数据资产管理行使权力和控制的活动集合。其最终目的是挖掘数据价值,推动业务发展,实现盈利。……查看详情

    发布时间:2021.03.06来源:亿信数据治理知识库浏览量:109次

  • 数据问题的全面解决之道——数据治理

    数据问题的全面解决之道——数据治理

    当今的大型企业,内部分工日趋细化,采购、服务、市场、销售、开发、支持、物流、财务、人力等各个环节,无不每时每刻产生着大量的数据。……查看详情

    发布时间:2019.01.18来源:亿信华辰浏览量:93次

  • 创新者的破局之路:煤炭行业首个集团级数据治理项目落地

    创新者的破局之路:煤炭行业首个集团级数据治理项目落地

    工业互联网激起能源领域一池春水,新一代信息技术则是其不断发展的加速器。山东能源集团下属临沂矿业集团有限责任公司(以下简称临矿集团)率先在……查看详情

    发布时间:2021.01.29来源:头条浏览量:91次

  • 如何保证所基于的数据具有高质量?

    如何保证所基于的数据具有高质量?

    基于数据决策的前提是数据可靠且相关,数据必须是“真实可信的”,否则“输出将是误导和无效的”。但是学校所收集的数据可能不完全,或者更新不及……查看详情

    发布时间:2020.10.31来源:知乎浏览量:85次

  • 浅谈数据质量管理

    浅谈数据质量管理

    随着互联网及数字化技术的飞速发展,我们生活在一个数字化转型的时代,各种数字化正在实实在在的改变着企业的日常运营,以及我们每个人的衣食住行……查看详情

    发布时间:2019.07.17来源:知乎浏览量:81次

  • 企业数据中台建设过程中面临的三大挑战

    企业数据中台建设过程中面临的三大挑战

    业务挑战:如何以大数据赋能,反哺业务精耕? 越是成功的企业,业务发展的痛点越难以单点解决,需要整体思考、科学决策、集体行动,在业务的创……查看详情

    发布时间:2020.07.10来源:知乎浏览量:95次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议