如何获得各部门系统的数据?
发布时间:2020.10.31来源:知乎浏览量:124次标签:数据治理
范德比尔特大学 (Vanderbilt University) 建立了“自动数据质量流程”,其信息系统能够识别数据输入错误, 所有数据问题最终都由学校数据治理团队 (institutional data governance team) 解决。根据大学的说法,该团队的任务是“建立数据治理政策、程序、标准和指南”,以最大化学校数据的价值。
范德比尔特大学 (Vanderbilt University) 建立了“自动数据质量流程”,其信息系统能够识别数据输入错误, 所有数据问题最终都由学校数据治理团队 (institutional data governance team) 解决。根据大学的说法,该团队的任务是“建立数据治理政策、程序、标准和指南”,以最大化学校数据的价值。
数据使用边界与伦理
使用学生数据进行学习分析会在多大程度上引发有关学生数据隐私的问题?高校如何使用和共享这些数据 ? 如何审查依据数据的行动是否有伦理风险?当机器学习算法出错,无意中引导学生走向错误的方向时,会发生什么情况?
目前有很多数据分析项目是基于历史数据而做预测分析,但所有预测模型都受人类判断的影响,数十年来对隐性偏见的研究表明,潜在的认知偏见和系统性种族偏见,既影响数据模型的设计,也影响对
研究结果的解释。比如,预测模型如果过度依赖关键的学生人口数据,如财务状况、家庭经济状况、种族、性别或文化背景, 很容易使教育机会存在的历史性结构不平等永久化。预测分析模型另一个潜在偏见是“确认偏见”,当设计预测模型的人倾向于寻找并使用信息来支持他们自己已有的想法或信念时,就会发生这种情况。在这些情况下,不能支持他们思想的信息将被忽略或丢弃,“确认偏见”既会影响选择(或未选择)的数据类型,也会影响对那些数据相关的解释。因此,“深入理解分析方法背后的假设”至关重要。
消除预测模型中偏见的一个方法就是承认它。要认识到数据的选择、模型的定义、对发现的解释,以及基于这些模型采取的行动不可避免地受到“隐性偏见”的影响。在数据上贴上预测分析标签并不能确保判断错误不会发生,也不能减轻这样一个事实,即这些偏见在多样性背景下是极其成问题的。因此,我们必须不断挑战数据的来源、假设、数据收集方法、数据的解释和使用,特别是当数据涉及代表性不足群体或少数民族群体方面时。在高等教育中,我们不仅要注重模拟结果的轨迹, 还要注重改变或破坏现有状态结果的创新方法。在继续推进数据驱动决策和预测模型分析的同时,必须牢记数据是可能有偏见的。
数据治理项目成功关键
已经有一些数据分析项目获得成功的高校总结出以下成功经验:
1.管理层支持:学校管理层是真正希望获取数据,并努力尽可能多地使用这些数据。为此,要专门成立数据治理管理机构,组织人力花时间有效地挖掘数据。
普度大学(Purdue University)的“院校研究、评估和有效性办公室”(Office of Institutional Research, Assessment and Effectiveness) 设立了几个委员会,专门负责高校数据治理政策和标准研究,甚至还设立了一个数据质量小组(data quality subcommittee),专注于寻找数据质量问题的解决方案。
2.有强大的、标准化的基础设施:数据分析需要更强大的技术架构和熟练的专业人员。
3.直观的用户界面和报告:研究用户友好的数据分析产品,使更广泛的校园工作人员参与设计和展示数据分析成为可能。当目标明确、可衡量的结果有针对性时,分析效果最佳。
4.供应商透明度:为了确保模型和算法是健全的、透明的、没有偏见的,必须密切参与或了解预测模型和算法是如何构建的。
5.持续培训:持续介绍有什么数据分析系统可用,如何使用,持续培训会提高使用数据做决策的能力。
除了确保这些因素到位之外,重要的是确保教师、员工和学生具有数据读写技能,能有效地解析数据,从而在所有领域实现性能改进。
-
大数据治理需要具备哪些能力和关键技术
从企业的数据资产管理和提升数据质量等的数据应用上,大数据治理的内容在不断地发展和完善,在其落地实施的过程中面临着巨大的挑战。我们现在通过……查看详情发布时间:2019.08.13来源:知乎浏览量:87次
-
数据信任是智能城市数据治理的一部分吗?
鉴于最近的丑闻,城市别无选择,只能紧急关注数据治理问题。数据信任可以成为解决方案的一部分吗?……查看详情发布时间:2019.03.25来源:亿信华辰浏览量:56次
-
不治理就破产—谈大数据时代的数据治理
随着Hadoop技术的提升,数据如何进来,如何整合,开展什么样的应用都已经有了成熟的案例,可是,同传统数仓时代一样,垃圾进垃圾出,如何破……查看详情发布时间:2019.02.21来源:知乎浏览量:65次
-
企业的数据标准管理包括什么?
数据标准(Data Standards)是保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准管理是规范数据标准的制定和实施……查看详情发布时间:2020.05.08来源:知乎浏览量:89次
-
定义DG:数据治理可以为您做什么?
由于数据驱动的业务,数据治理(DG)变得越来越普遍,但是对于许多组织来说,定义DG并进行合理的实践仍然很困难。……查看详情发布时间:2019.01.21来源:亿信华辰浏览量:89次
-
方法论:如何从0到1搭建企业级主数据管理平台
企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业……查看详情发布时间:2020.12.04来源:知乎浏览量:129次
-
形成,风暴,规范,表演 - 实现数据治理
启动数据治理计划是整个组织需要参与的重要任务。来自数据治理团队的这些见解已经在他们的旅程中取得了一些进展,这突出了团队内部和整个组织内的……查看详情发布时间:2019.02.25来源:亿信华辰浏览量:73次