数据质量监控步骤及方法

发布时间:2020.08.31来源:CSDN浏览量:391次标签:数据治理

随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一切的数据驱动决策的前提!如何保障数据质量,确保数据可用性是每一位数据人都不可忽略的重要环节。
数据质量监控
大数据处理中数据质量监控从哪几个方面进行?

数据容量(Volume):数据的大小决定所考虑的数据的价值的和潜在的信息;
数据种类(Variety):数据类型的多样性;
数据速度(Velocity):指获得数据的速度;
数据可变性(Variability):妨碍了处理和有效地管理数据的过程;
数据真实性(Veracity):数据的质量;
数据复杂性(Complexity):数据量巨大,来源多渠道。

数据质量监控怎么做?

四大关注点
先简单地聊一下数据质量需要关注的四个点:即完整性、准确性、一致性和及时性。这四个关注点,会在我们的数据处理流程的各个环节有所体现。

一、完整性
完整性是指数据的记录和信息是否完整,是否存在缺失的情况。数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成统计结果不准确,所以说完整性是数据质量最基础的保障。
简单来讲,如果要做监控,需要考虑两个方面:一是,数据条数是否少了,二是,某些字段的取值是否缺失。完整性的监控,多出现在日志级别的监控上,一般会在数据接入的时候来做数据完整性校验。

二、准确性
准确性是指数据中记录的信息和数据是否准确,是否存在异常或者错误的信息。
直观来讲就是看数据是否上准确的。一般准确性的监控多集中在对业务结果数据的监控,比如每日的活跃、收入等数据是否正常。

三、一致性
一致性是指同一指标在不同地方的结果是否一致。
数据不一致的情况,多出现在数据系统达到一定的复杂度后,同一指标会在多处进行计算,由于计算口径或者开发人员的不同,容易造成同一指标出现的不同的结果。

四、及时性
在确保数据的完整性、准确性和一致性后,接下来就要保障数据能够及时产出,这样才能体现数据的价值。
及时性很容易理解,主要就是数据计算出来的速度是否够快,这点在数据质量监控中可以体现在监控结果数据数据是否在指定时间点前计算完成。

数据质量监控之所以难做,是因为在数据的各个环节都会出现数据质量的问题。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。好好把握这几个点才能更好地进行数据质量监控。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 做好数据治理,助力政府治理体系和治理能力现代化

    做好数据治理,助力政府治理体系和治理能力现代化

    当前,数据及其技术的融合应用在政府经济调节、市场监管、社会管理、公共服务、生态环境保护等各项工作中强劲助攻、潜力无限。但由于数据是新型生……查看详情

    发布时间:2020.04.02来源:知乎浏览量:175次

  • 关于数据治理的十件事

    关于数据治理的十件事

    数据治理是我们现在遇到的众多热门词汇之一。有人可能会说这是炒作,但我不这么认为。出于许多好的理由,这是我们的首要考虑,其中一些我们在下面……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:187次

  • 北大光华王汉生教授万字长文,讲透数据治理问题!

    北大光华王汉生教授万字长文,讲透数据治理问题!

    2018年3月16日,中国银监会发布了《银行业金融机构数据治理指引(征求意见稿)》,就相关数据治理问题,向全社会公开征求意见,至此银行业……查看详情

    发布时间:2019.06.03来源:王汉生浏览量:160次

  • 数据管理政策:数据治理的基石

    数据管理政策:数据治理的基石

    您的组织可能认为或可能不认为您需要,但我在此告诉您,数据管理策略是管理企业数据资产的基石。……查看详情

    发布时间:2019.01.22来源:亿信华辰浏览量:200次

  • 业务词汇表和元数据:数据治理和词汇表准备

    业务词汇表和元数据:数据治理和词汇表准备

    如果您能说出数据治理计划的目标并拥有赞助组织,那么您可能已经准备好了 在回答How,When和Where问题之前,您需要回答Why,Wh……查看详情

    发布时间:2019.01.22来源:亿信华辰浏览量:178次

  • 数据治理之道帮助企业完成数字化转型

    数据治理之道帮助企业完成数字化转型

    数据治理不能再只是面向数据部门了,需要成为面向全企业用户的工作环境,需要以全企业用户为中心,从给用户提供服务的角度,管理好数据的同时为用……查看详情

    发布时间:2020.06.28来源:知乎浏览量:144次

  • 数据标准从发起到落地执行的四个阶段

    数据标准从发起到落地执行的四个阶段

    数据标准的设计从需求发起到落地执行,一般需要经过标准编制、标准审查、标准发布、标准贯彻四个阶段:……查看详情

    发布时间:2020.09.24来源:知乎浏览量:141次

  • 企业怎样建立完整的数据治理体系?

    企业怎样建立完整的数据治理体系?

    大数据智能时代,管理不再是传统的做法,一套完善的数据管理体系是企业长远要生存的必须择决。我们的生活已经离不开大数据,企业的数据管理不仅能……查看详情

    发布时间:2020.03.26来源:知乎浏览量:131次

  • 医疗领域的数据治理

    医疗领域的数据治理

    数据治理将为患者和护理人员实现价值。医疗保健系统和提供者越来越关注使用证据来为临床和运营决策提供信息的需求。这导致他们组装并批判性地评估……查看详情

    发布时间:2018.11.20来源:Lydia Lee浏览量:162次

  • 大数据时代企业数据治理应该怎么做?

    大数据时代企业数据治理应该怎么做?

    大数据不是凭空而来的,1981年第一个数据仓库诞生,到现在已经有近40年的历史了,而国内的企业数据平台的建设是从90年代末才开始的,从第……查看详情

    发布时间:2019.08.01来源:知乎浏览量:152次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议