打破数据治理:数据质量

发布时间:2019.07.11来源:知乎浏览量:116次标签:数据治理

随着越来越多的大学将数据视为负责任的战略规划和计划的关键,许多人都意识到:有些数据比其他数据更好 - 糟糕的数据可能比没有数据更糟糕。

根据最近的一份白皮书,超过6个高等教育机构正在考虑启动校园数据分析计划或已经有这样的计划。


大多数人认为他们可以从数据中获得的见解对提高运营效率至关重要,但越来越多的人也使用数据和分析来帮助推动学生的成功。在所有这些举措中,参与数据管理和利用的人员都依赖于相关性和可靠性。


但是,数据治理的这一部分 - 数据质量的保证 - 对于任何机构来说都是一个困难的命题。鉴于可用数据的数量和种类繁多,如何才能知道什么是好的,什么不是?


专家说,答案涉及多管齐下的方法,包括部署专门工具以简化数据收集,并通过专业支持和培训致力于最佳实践。


在2018年关于高等教育数据治理的研究中,Cary Jim和Hsia-Ching Chang写道,数据质量是“数据驱动决策过程的基础”。


作者指出,数据必须是“真实和值得信赖的”,或者“输出会产生误导和无效。”这里概述了许多大学在转向分析时所面临的数据质量问题,并仔细研究了它们的可能性。解决。


高等教育中的数据质量问题
也许机构反复面临的最大数据质量挑战与大量潜在数据源有关。

无论他们是否正在运行数据分析计划,大学都会收集有关任何事物和数据的数据,从学生人口统计到校内和校外住房,再到影响整体绩效的各种业务变量。
正如圣母大学的商业智能经理Chris Frederick 在2018年与EdTech的问答中解释的那样,“如果你问我们有多少学生,不同的小组可能会给你五个不同的答案。”

弗雷德里克说,这些团体都必须“在同一页面上”,以确保他们“ 从我们都信任并同意的来源工作 ” 。”

说明类似的观点,教育咨询公司EAB描述了它认为仅在学术方面的主要数据质量挑战。

其中,该公司报告说,个别教师的责任,教授和部门代码过时或混乱,以及机构记录课程部分最大容量的方式不一致,是不准确的表格。


例如,最后一个问题可能导致课程部分填写率的错误计算。EAB表示,这反过来可能导致盈余部分,导致“资源浪费”。
更多来自EDTECH:了解大学如何解决数据分析程序的复杂性。
高等教育数据治理可以解决数据质量困境
据IBM称,高质量数据包括四个“ 关键属性 ”:

完整性:必须从所有可能的来源链接相关数据。
准确性:数据必须正确且一致,例如没有拼写错误。
可用性:数据必须按需提供。
及时性:当前数据必须可用。 


由于大学和大学处理如此多的数据,大多数人选择实施数据质量工具 - 参见Gartner的2019年顶级供应商魔力象限 - 通过数据清理,匹配,监控和其他方式实现大部分质量保证流程的自动化。


除了可用的IT解决方案之外,最可靠的数据质量保证途径通常还包括教育和协作的结合。
例如,在普渡大学,其机构研究,评估和有效性办公室建立了几个致力于高等教育标准和数据治理的委员会,甚至还设立了一个数据质量小组委员会,专注于寻找数据质量问题的解决方案。
在Vanderbilt大学,他们依赖“自动数据质量流程”,包括识别数据输入错误的IT系统,所有数据问题最终都由其机构数据治理团队解决。
据该大学称,该团队的使命是“ 建立数据治理政策,程序,标准和指南 ”,以最大限度地提高范德比尔特数据的价值。
就其本身而言,EAB 建议 IT专业人员和教师共同制定政策和流程,推动大学实现更好的数据管理。
该公司表示,数据治理应属于两个主要群体的范围:高管的“优先级委员会”,以及代表该机构各部门的“以定义和访问为重点的技术专家和数据保管委员会”。
要求所有利益相关方在数据治理中发挥作用,它和业内其他人建议,很快那些唠叨“数据质量问题”的人将成为机构发展的机会。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议