大数据环境下数据质量管理面临的挑战

发布时间:2019.12.27来源:CSDN浏览量:197次标签:数据治理

随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术飞速发展的今天,越来越多的企业业务和社会活动实现了数字化。全球最大的零售商沃尔玛,每天通过分布在世界各地的6000多家商店向全球客户销售超过2.67亿件商品,每小时获得2.5PB的交易数据。而物联网下的传感数据也慢慢发展成了大数据的主要来源之一。有研究估计,2015年全球数据量为8ZB,而到2020年则高达35.2ZB,是2015年数据量的44倍之多。此外,随着移动互联网、web2.0技术和电子商务技术的飞速发展,大量的多媒体内容在指数增长的数据量中发挥着重要作用。


大数据时代下的数据与传统数据呈现出了重大差别,直接影响到数据在流转环节中的各个方面,给数据存储处理分析性能、数据质量保障都带来了很大挑战。大数据与传统数据对比如表1所示。

由于以上特性,大数据的信息系统更容易产生数据质量问题:

(1)在数据收集方面,大数据的多样性决定了数据来源的复杂性。来源众多、结构各异、大量不同的数据源之间存在着冲突、不一致或相互矛盾的现象。在数据获取阶段保证数据定义的完整性、数据质量的可靠性尤为必要。

大数据与传统数据特点对比

理,远远处理不了大数据环境下的数据问题。

(3)由于高速性,数据的大量更新会导致过时数据迅速产生,也更易产生不一致数据。

(4)由于发展迅速,市场庞大,厂商众多,直接产生的数据或者产品产生的数据标准不完善,使得数据有更大的可能产生不一致和冲突。

(5)由于数据生产源头激增,产生的数据来源众多,结构各异,以及系统更新升级加快和应用技术更新换代频繁,使得不同的数据源之间、相同的数据源之间都可能存在着冲突、不一致或相互矛盾的现象,再加上数据收集与集成往往由多个团队协作完成,期间增大了数据处理过程中产生问题数据的概率。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理委员会:指导原则

    数据治理委员会:指导原则

    数据所有权 指定义与特定数据集相关的各种责任级别。讨论谁负责特定的数据任务已经使我们机构的数据维护和准确性变得更加简单。……查看详情

    发布时间:2018.11.23来源:数据治理浏览量:162次

  • 数据安全事件频发的当下,如何保障数据治理过程中的绝对安全?

    数据安全事件频发的当下,如何保障数据治理过程中的绝对安全?

    在数据治理过程中,如果数据不安全会导致数据治理不到位,甚至是治理好的数据被滥用或盗用。数据安全问题其实说白了通常是由于防范不到位、管理不……查看详情

    发布时间:2020.10.21来源:知乎浏览量:207次

  • 治理与管理的区别

    治理与管理的区别

    简而言之,董事会负责监督,规划和管理负责日常运营。每个部分的职责和责任细分更为广泛。无论您采用广泛还是狭隘的方法来处理治理和管理之间的差……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:184次

  • 构建有效的数据科学团队

    构建有效的数据科学团队

    随着数据科学和人工智能几乎进入阳光下的每个行业,建立一个能够建立成功的AI项目的团队的挑战也是如此。对统计学家,程序员和沟通者完美融合的……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:206次

  • 从大数据到好数据:缩小数据治理和业务洞察力之间的差距

    从大数据到好数据:缩小数据治理和业务洞察力之间的差距

    尽管在大数据技术上的支出不断增加,但许多组织仍在努力如何从日益增长的数字世界中寻找意义。 ……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:125次

  • 为数据管理/数据质量/问题分析提供资金

    为数据管理/数据质量/问题分析提供资金

    大多数具有正式数据治理工作的组织都对正在进行的数据管理工作给予了高度关注,解决了利益相关者之间发生自然冲突和/或数据质量工作时出现的问题……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:160次

  • 数据分析加数据治理-让数据清澈如水

    数据分析加数据治理-让数据清澈如水

    在如今数据大浪潮下,如果您的业务很多,那么它就会大量堆积并且产生新的问题。我们生活在一个数据驱动的世界里。数据推动了我们从不同地方获得的……查看详情

    发布时间:2019.08.30来源:浏览量:206次

  • 数据治理的发展历程

    数据治理的发展历程

    数据治理技术的发展使得其中最好的技术为组织的数据景观提供了完全的透明性,并为业务用户在搜索、访问和应用数据时提供了一种方便快捷的体验。……查看详情

    发布时间:2018.11.19来源:艾米丽华盛顿浏览量:218次

  • 最全数据治理工具解析:数据治理工具的关键必备功能

    最全数据治理工具解析:数据治理工具的关键必备功能

    ​数据治理工具被定义为帮助创建和维护一组结构化策略、程序和协议的过程的工具,这些策略、程序和协议控制企业数据的存储、使用和管理方式。本文……查看详情

    发布时间:2021.07.22来源:亿信华辰数据治理浏览量:397次

  • 治理成熟度差距以及如何克服它

    治理成熟度差距以及如何克服它

    了解您在真正的IG成熟度方面的立场,并在自己和团队中识别变革的阻力。不要回避要求定期审核和验尸以评估进度和后续步骤。通过具体信息,您可以……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:163次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议