大数据环境下数据质量管理面临的挑战

发布时间:2019.12.27来源:CSDN浏览量:185次标签:数据治理

随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术飞速发展的今天,越来越多的企业业务和社会活动实现了数字化。全球最大的零售商沃尔玛,每天通过分布在世界各地的6000多家商店向全球客户销售超过2.67亿件商品,每小时获得2.5PB的交易数据。而物联网下的传感数据也慢慢发展成了大数据的主要来源之一。有研究估计,2015年全球数据量为8ZB,而到2020年则高达35.2ZB,是2015年数据量的44倍之多。此外,随着移动互联网、web2.0技术和电子商务技术的飞速发展,大量的多媒体内容在指数增长的数据量中发挥着重要作用。


大数据时代下的数据与传统数据呈现出了重大差别,直接影响到数据在流转环节中的各个方面,给数据存储处理分析性能、数据质量保障都带来了很大挑战。大数据与传统数据对比如表1所示。

由于以上特性,大数据的信息系统更容易产生数据质量问题:

(1)在数据收集方面,大数据的多样性决定了数据来源的复杂性。来源众多、结构各异、大量不同的数据源之间存在着冲突、不一致或相互矛盾的现象。在数据获取阶段保证数据定义的完整性、数据质量的可靠性尤为必要。

大数据与传统数据特点对比

理,远远处理不了大数据环境下的数据问题。

(3)由于高速性,数据的大量更新会导致过时数据迅速产生,也更易产生不一致数据。

(4)由于发展迅速,市场庞大,厂商众多,直接产生的数据或者产品产生的数据标准不完善,使得数据有更大的可能产生不一致和冲突。

(5)由于数据生产源头激增,产生的数据来源众多,结构各异,以及系统更新升级加快和应用技术更新换代频繁,使得不同的数据源之间、相同的数据源之间都可能存在着冲突、不一致或相互矛盾的现象,再加上数据收集与集成往往由多个团队协作完成,期间增大了数据处理过程中产生问题数据的概率。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据标准从发起到落地执行的四个阶段

    数据标准从发起到落地执行的四个阶段

    数据标准的设计从需求发起到落地执行,一般需要经过标准编制、标准审查、标准发布、标准贯彻四个阶段:……查看详情

    发布时间:2020.09.24来源:知乎浏览量:141次

  • 世界各地的组织如何处理数据治理

    世界各地的组织如何处理数据治理

    在2019年G20大阪峰会召开的同时,我很幸运能够在整个六月的整个月里在东京办公室工作。这是一个有趣的事件,引起我注意的主要议题之一是“……查看详情

    发布时间:2019.07.11来源:知乎浏览量:152次

  • 数据治理——银行将被如何规范?

    数据治理——银行将被如何规范?

    我们认为,此番对数据治理的指引,未来可能会被其他金融监管机构作为范本,约束互联网金融或其他业态的数据治理行为,因此,具有学习和研究价值。……查看详情

    发布时间:2019.01.18来源:亿信华辰浏览量:150次

  • 大数据资产管理总体框架概述

    大数据资产管理总体框架概述

    随着大数据时代的来临,对数据的重视提到了前所未有的高度,“数据即资产”已经被广泛认可。数据就像企业的根基,是各企业尚待发掘的财富,即将被……查看详情

    发布时间:2020.08.28来源:知乎浏览量:150次

  • 大数据时代下金融数据治理的问题

    大数据时代下金融数据治理的问题

    数据治理是一套完整的制度、指引和规范,用于统筹人员、流程以及技术等要素,使得商业银行能将数据作为企业的重要资产而有效利用,其核心内容是统……查看详情

    发布时间:2019.10.17来源:知乎浏览量:184次

  • 让数据清澈如水:数据清洗的策略与方法

    让数据清澈如水:数据清洗的策略与方法

    在数据仓库中,数据是面向某一主题的数据的集合,这些数据从多个业务系统抽取而来,不同的数据来源加上历史数据的堆积,难免会有问题数据出现,这……查看详情

    发布时间:2020.11.23来源:亿信华辰浏览量:238次

  • 企业数据治理到底怎么做?

    企业数据治理到底怎么做?

    数据治理对于确保数据的准确、适度分享和保护是至关重要的。有效的数据治理计划会通过改进决策、缩减成本、降低风险和提高安全合规等方式,将价值……查看详情

    发布时间:2019.08.30来源:知乎浏览量:165次

  • 数据治理金融行业解决方案

    数据治理金融行业解决方案

    我国银行数据现状1、缺乏数据梳理,造成行领导看到的数据相互冲突和矛盾 2、业务职能不清晰或相互重叠,观察数据视角不尽相同,缺少数据标准与……查看详情

    发布时间:2019.08.26来源:知乎浏览量:210次

  • 医疗领域的数据治理

    医疗领域的数据治理

    数据治理将为患者和护理人员实现价值。医疗保健系统和提供者越来越关注使用证据来为临床和运营决策提供信息的需求。这导致他们组装并批判性地评估……查看详情

    发布时间:2018.11.20来源:Lydia Lee浏览量:162次

  • 开创数据治理新局面

    开创数据治理新局面

    当前,大数据发展日新月异。深入推动实施国家大数据战略需要深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成……查看详情

    发布时间:2019.02.25来源:光明网浏览量:142次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议