数据清洗与数据治理的3个不同点

发布时间:2021.04.09来源:亿信数据治理研究院浏览量:759次标签:数据治理

数据清洗,是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。数据清洗工作是现阶段大部分的数据类信息化项目中所必备的一个步骤,也是数据治理工作中必不可少的一项关键任务,是数据治理的子集,其不同之处主要表现在以下几点:

1、概念不同:数据治理主要是宏观上对数据的管理,由国家或行业制定制度,是一整套的方法和知识体系,更具有稳定性。数据清洗是数据在指定数据规则对混乱数据进行清洗,规则由自己设定,数据清洗主要是微观上对数据的清洗、标准化的过程;

2、作用域不同:数据治理影响整个数据的生命周期,对数据的管理组织、制度、规范、方法、技术、标准等都有影响,而数据清洗仅仅作用于数据本身;

3、目的不同:数据治理属于顶层设定、具有权威性,目的是为整个组织全域的数据生命周期管理提供科学的、可执行的综合管理机制,而数据清洗由需要的部门或者独立任务提出,随意性比较强。

因此,数据治理不是数据清洗的简单升级,两者之间更多的是包含与需要的关系。拿前面讲到的“书籍治理”举例,数据清洗更像是为了某次书籍的外借而进行的一次简单整理,但是过一段时间还会乱。而数据治理,则是前面所讲到的完整的体系。


了解更多数据治理相关知识:https://www.esenruizhi.com/.


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议