数据质量监控步骤及方法

发布时间:2020.08.31来源:CSDN浏览量:458次标签:数据治理

随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一切的数据驱动决策的前提!如何保障数据质量,确保数据可用性是每一位数据人都不可忽略的重要环节。
数据质量监控
大数据处理中数据质量监控从哪几个方面进行?

数据容量(Volume):数据的大小决定所考虑的数据的价值的和潜在的信息;
数据种类(Variety):数据类型的多样性;
数据速度(Velocity):指获得数据的速度;
数据可变性(Variability):妨碍了处理和有效地管理数据的过程;
数据真实性(Veracity):数据的质量;
数据复杂性(Complexity):数据量巨大,来源多渠道。

数据质量监控怎么做?

四大关注点
先简单地聊一下数据质量需要关注的四个点:即完整性、准确性、一致性和及时性。这四个关注点,会在我们的数据处理流程的各个环节有所体现。

一、完整性
完整性是指数据的记录和信息是否完整,是否存在缺失的情况。数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成统计结果不准确,所以说完整性是数据质量最基础的保障。
简单来讲,如果要做监控,需要考虑两个方面:一是,数据条数是否少了,二是,某些字段的取值是否缺失。完整性的监控,多出现在日志级别的监控上,一般会在数据接入的时候来做数据完整性校验。

二、准确性
准确性是指数据中记录的信息和数据是否准确,是否存在异常或者错误的信息。
直观来讲就是看数据是否上准确的。一般准确性的监控多集中在对业务结果数据的监控,比如每日的活跃、收入等数据是否正常。

三、一致性
一致性是指同一指标在不同地方的结果是否一致。
数据不一致的情况,多出现在数据系统达到一定的复杂度后,同一指标会在多处进行计算,由于计算口径或者开发人员的不同,容易造成同一指标出现的不同的结果。

四、及时性
在确保数据的完整性、准确性和一致性后,接下来就要保障数据能够及时产出,这样才能体现数据的价值。
及时性很容易理解,主要就是数据计算出来的速度是否够快,这点在数据质量监控中可以体现在监控结果数据数据是否在指定时间点前计算完成。

数据质量监控之所以难做,是因为在数据的各个环节都会出现数据质量的问题。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。好好把握这几个点才能更好地进行数据质量监控。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 用大数据提高社会治理智能化水平

    用大数据提高社会治理智能化水平

    大数据为提高我国社会治理智能化水平开辟了广阔空间。用大数据提高社会治理智能化水平,关键在于找准大数据与社会治理创新的契合点,将大数据同社……查看详情

    发布时间:2019.10.18来源:人民网浏览量:193次

  • 资金模型:资助数据治理

    资金模型:资助数据治理

    数据治理框架以两种方式解决资金问题……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:246次

  • 数据中台不等于大数据平台-数据中台价值

    数据中台不等于大数据平台-数据中台价值

    数据中台不等于大数据平台,数据中台的核心工作也并不是将企业的数据全部收集起来做汇总就够了。数据中台的使命是利用大数据技术、通过全局规划来……查看详情

    发布时间:2020.11.21来源:知乎浏览量:258次

  • 为什么数据治理会带来数据驱动的成功

    为什么数据治理会带来数据驱动的成功

    通过寻找创造价值和改进执行的新方法,各种形式和规模的组织都在积极地采用数据驱动的方法,这些方法可以通过分析的进步来实现。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:211次

  • 数据治理方法 | 美国高校数据治理方法借鉴

    数据治理方法 | 美国高校数据治理方法借鉴

    高等教育中的数据治理是一种风险管理工具,可促进家庭教育和监管合规性,因为它旨在保护隐私和敏感信息。最后,数据是一种资产,如果使用得当,可……查看详情

    发布时间:2021.06.02来源:亿信华辰数据治理知识库浏览量:190次

  • 2019年数据保护政策趋势展望

    2019年数据保护政策趋势展望

    在全球数据保护法律政策中,欧美仍将扮演引领性角色。欧盟“e-PR”或带来更严格规制。美国联邦与地方隐私立法互补。……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:180次

  • 四说大数据时代“神话”:从大数据到深数据

    四说大数据时代“神话”:从大数据到深数据

    为国内最大的电商平台之一,苏宁每天要处理数量巨大的数据。为了更快速高效地处理这些数据,苏宁调度平台采取了哪些措施呢?……查看详情

    发布时间:2019.02.14来源:亿信华辰浏览量:211次

  • 可以加强您的数据治理框架的五大方面

    可以加强您的数据治理框架的五大方面

    信息就是力量,您的组织每天都依靠它来做出明智的商业决策。不幸的是,组织产生的数据并没有按照应有的方式进行管理。大数据调查表明,业务和技术……查看详情

    发布时间:2019.07.04来源:知乎浏览量:249次

  • 一文说清数据资产

    一文说清数据资产

    为什么说数据是资产何为数据资产,首页我们先了解一下数据到底是什么?按照一般的定义,数据就是数值,是通过我们的观察、实验和计算得出的结果。……查看详情

    发布时间:2020.07.17来源:CSDN浏览量:183次

  • 敏捷/精益数据治理最佳实践

    敏捷/精益数据治理最佳实践

    数据治理 的目标 是确保组织内的质量,可用性,完整性,安全性和可用性。你对此的看法取决于你。许多传统的数据治理方法似乎在实践中都很困难,……查看详情

    发布时间:2018.12.18来源:数据治理浏览量:162次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议