数据质量监控步骤及方法

发布时间:2020.08.31来源:CSDN浏览量:271次标签:数据治理

随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一切的数据驱动决策的前提!如何保障数据质量,确保数据可用性是每一位数据人都不可忽略的重要环节。
数据质量监控
大数据处理中数据质量监控从哪几个方面进行?

数据容量(Volume):数据的大小决定所考虑的数据的价值的和潜在的信息;
数据种类(Variety):数据类型的多样性;
数据速度(Velocity):指获得数据的速度;
数据可变性(Variability):妨碍了处理和有效地管理数据的过程;
数据真实性(Veracity):数据的质量;
数据复杂性(Complexity):数据量巨大,来源多渠道。

数据质量监控怎么做?

四大关注点
先简单地聊一下数据质量需要关注的四个点:即完整性、准确性、一致性和及时性。这四个关注点,会在我们的数据处理流程的各个环节有所体现。

一、完整性
完整性是指数据的记录和信息是否完整,是否存在缺失的情况。数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成统计结果不准确,所以说完整性是数据质量最基础的保障。
简单来讲,如果要做监控,需要考虑两个方面:一是,数据条数是否少了,二是,某些字段的取值是否缺失。完整性的监控,多出现在日志级别的监控上,一般会在数据接入的时候来做数据完整性校验。

二、准确性
准确性是指数据中记录的信息和数据是否准确,是否存在异常或者错误的信息。
直观来讲就是看数据是否上准确的。一般准确性的监控多集中在对业务结果数据的监控,比如每日的活跃、收入等数据是否正常。

三、一致性
一致性是指同一指标在不同地方的结果是否一致。
数据不一致的情况,多出现在数据系统达到一定的复杂度后,同一指标会在多处进行计算,由于计算口径或者开发人员的不同,容易造成同一指标出现的不同的结果。

四、及时性
在确保数据的完整性、准确性和一致性后,接下来就要保障数据能够及时产出,这样才能体现数据的价值。
及时性很容易理解,主要就是数据计算出来的速度是否够快,这点在数据质量监控中可以体现在监控结果数据数据是否在指定时间点前计算完成。

数据质量监控之所以难做,是因为在数据的各个环节都会出现数据质量的问题。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。好好把握这几个点才能更好地进行数据质量监控。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 如何制定数据标准

    如何制定数据标准

    企业的数据标准来源非常丰富,有外部的监管要求,行业的通用标准,同时也必须考虑到企业内部数据的实际情况,梳理其中的业务指标、数据项、代码等……查看详情

    发布时间:2020.11.13来源:知乎浏览量:118次

  • 什么是数据集成?

    什么是数据集成?

    数据集成是将来自不同来源的数据组合到统一视图中的过程:从摄取,清理,映射和转换到目标接收器,最后使数据对访问它的人更具可操作性和价值。 ……查看详情

    发布时间:2018.12.20来源:数据治理浏览量:110次

  • 数据中心基于政府数据治理的工作清单

    数据中心基于政府数据治理的工作清单

    随着信息社会不断向纵深发展,数据和信息作为战略性资源的价值正在快速提升。人类社会正在进入数据时代,从关注网络、系统到注重数据,已成为当前……查看详情

    发布时间:2018.09.30来源:数据治理浏览量:147次

  • 数据质量稳定提升方法:使用反馈循环

    数据质量稳定提升方法:使用反馈循环

    每个额外的数据源都给流程增加了更多的复杂性,并且至少在短期内,在流程自动化之前消耗了额外的时间。现在是时候这些数据专业人员可以专门回答业……查看详情

    发布时间:2021.04.23来源:亿信数据治理知识库浏览量:164次

  • 有效数据治理的几个原则

    有效数据治理的几个原则

    一个好的数据中心将利用自己现有的技术和设备,向用户提供服务,尽量减少操作和维护成本,并最大限度地提高利润。如果你经常担心数据的准确性,并……查看详情

    发布时间:2019.10.21来源:知乎浏览量:109次

  • 金融数据治理的特征与趋势

    金融数据治理的特征与趋势

    大数据时代下金融数据治理的特征(一)金融数据治理目标双核化进入“大数据时代”,不仅更多的金融业态被催生出来,数据……查看详情

    发布时间:2019.01.04来源:亿信华辰浏览量:131次

  • 数据治理的重点领域:专注于数据仓库和商业智能(BI)

    数据治理的重点领域:专注于数据仓库和商业智能(BI)

    这种类型的程序通常与特定的数据仓库,数据集市或BI工具一起出现。……查看详情

    发布时间:2019.03.29来源:亿信华辰浏览量:149次

  • 数据共享,奇葩证明的解药——亿信华辰

    数据共享,奇葩证明的解药——亿信华辰

    出境旅游,要求出具“母子关系证明”;市民迁户口,要证明“你爸是你爸”;车在大风中被树木刮伤,理赔要出示“风力证明”;去买房,要证明“结婚……查看详情

    发布时间:2019.03.04来源:亿信华辰浏览量:123次

  • 一文讲透数据治理核心指标

    一文讲透数据治理核心指标

    股份制改革对我国银行业来说只是一个开始,企业在风险管理、创造价值等方面还有很长的路要走。风险管理要求提供精准的数据模型、创造价值要求充分……查看详情

    发布时间:2020.06.19来源:CSDN浏览量:120次

  • 企业数字化转型如何进行数据资源规划?

    企业数字化转型如何进行数据资源规划?

    企业主数据管理,就是将企业的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的清洗和丰富,并且以服务的方式把统一的、……查看详情

    发布时间:2020.04.03来源:知乎浏览量:119次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议