如何获得各部门系统的数据?

发布时间:2020.10.31来源:知乎浏览量:275次标签:数据治理

不少学校在开展数据治理的时候,会遇到部门数据共享的问题。一方面,一些部门不愿意分享所管理的数据,比如,认为拥有某些数据是特权,或担心数据安全; 另一方面,即使部门愿意共享数据,信息系统之间数据互通也会有技术障碍,比如,学校的信息系统有些是采购或定制的,供应商往往不太愿意做数据开放或数据导出接口,即使学校愿意在这方面做追加投资,也需要逐个系统去谈。有些系统有数据导出功能,可以定期导入到数据分析工具中,只是这些数据在利用时很难做到及时更新。数据需要在整个机构内共享-- 分析不应该以竖井的形式进行,也不应该被视为机构内部门的独有特权。

范德比尔特大学 (Vanderbilt University) 建立了“自动数据质量流程”,其信息系统能够识别数据输入错误, 所有数据问题最终都由学校数据治理团队 (institutional data governance team) 解决。根据大学的说法,该团队的任务是“建立数据治理政策、程序、标准和指南”,以最大化学校数据的价值。

范德比尔特大学 (Vanderbilt University) 建立了“自动数据质量流程”,其信息系统能够识别数据输入错误, 所有数据问题最终都由学校数据治理团队 (institutional data governance team) 解决。根据大学的说法,该团队的任务是“建立数据治理政策、程序、标准和指南”,以最大化学校数据的价值。

数据使用边界与伦理
使用学生数据进行学习分析会在多大程度上引发有关学生数据隐私的问题?高校如何使用和共享这些数据 ? 如何审查依据数据的行动是否有伦理风险?当机器学习算法出错,无意中引导学生走向错误的方向时,会发生什么情况?

目前有很多数据分析项目是基于历史数据而做预测分析,但所有预测模型都受人类判断的影响,数十年来对隐性偏见的研究表明,潜在的认知偏见和系统性种族偏见,既影响数据模型的设计,也影响对

研究结果的解释。比如,预测模型如果过度依赖关键的学生人口数据,如财务状况、家庭经济状况、种族、性别或文化背景, 很容易使教育机会存在的历史性结构不平等永久化。预测分析模型另一个潜在偏见是“确认偏见”,当设计预测模型的人倾向于寻找并使用信息来支持他们自己已有的想法或信念时,就会发生这种情况。在这些情况下,不能支持他们思想的信息将被忽略或丢弃,“确认偏见”既会影响选择(或未选择)的数据类型,也会影响对那些数据相关的解释。因此,“深入理解分析方法背后的假设”至关重要。

消除预测模型中偏见的一个方法就是承认它。要认识到数据的选择、模型的定义、对发现的解释,以及基于这些模型采取的行动不可避免地受到“隐性偏见”的影响。在数据上贴上预测分析标签并不能确保判断错误不会发生,也不能减轻这样一个事实,即这些偏见在多样性背景下是极其成问题的。因此,我们必须不断挑战数据的来源、假设、数据收集方法、数据的解释和使用,特别是当数据涉及代表性不足群体或少数民族群体方面时。在高等教育中,我们不仅要注重模拟结果的轨迹, 还要注重改变或破坏现有状态结果的创新方法。在继续推进数据驱动决策和预测模型分析的同时,必须牢记数据是可能有偏见的。

数据治理项目成功关键
已经有一些数据分析项目获得成功的高校总结出以下成功经验:

1.管理层支持:学校管理层是真正希望获取数据,并努力尽可能多地使用这些数据。为此,要专门成立数据治理管理机构,组织人力花时间有效地挖掘数据。

普度大学(Purdue University)的“院校研究、评估和有效性办公室”(Office of Institutional Research, Assessment and Effectiveness) 设立了几个委员会,专门负责高校数据治理政策和标准研究,甚至还设立了一个数据质量小组(data quality subcommittee),专注于寻找数据质量问题的解决方案。

2.有强大的、标准化的基础设施:数据分析需要更强大的技术架构和熟练的专业人员。

3.直观的用户界面和报告:研究用户友好的数据分析产品,使更广泛的校园工作人员参与设计和展示数据分析成为可能。当目标明确、可衡量的结果有针对性时,分析效果最佳。

4.供应商透明度:为了确保模型和算法是健全的、透明的、没有偏见的,必须密切参与或了解预测模型和算法是如何构建的。

5.持续培训:持续介绍有什么数据分析系统可用,如何使用,持续培训会提高使用数据做决策的能力。

除了确保这些因素到位之外,重要的是确保教师、员工和学生具有数据读写技能,能有效地解析数据,从而在所有领域实现性能改进。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 五方面提升银行业数据治理能力

    五方面提升银行业数据治理能力

    银行业面临着数据治理的紧迫需求,应该多措并举提升数据治理能力。……查看详情

    发布时间:2019.11.28来源:知乎浏览量:259次

  • 盘点数据治理的6个价值

    盘点数据治理的6个价值

    ​随着大数据的发展,各行各业都面临越来越庞大且复杂的数据,这些数据如果不能有效管理起来,不但不能成为企业的资产,反而可能成为拖累企业的“……查看详情

    发布时间:2022.06.15来源:互联网浏览量:335次

  • 数据治理管理干货 | 数据质量管理的方法

    数据治理管理干货 | 数据质量管理的方法

    原始数据通常包含错误,如果不做数据质量管理,可能会导致错误的结果。数据质量管理是数据治理中获得正确上下文和结论的基本步骤。……查看详情

    发布时间:2021.06.22来源:亿信数据治理知识库浏览量:246次

  • 怎样避免数据治理里面的坑?

    怎样避免数据治理里面的坑?

    数据治理是一项长期而繁杂的工作,很多时候大家都为如何做好数据治理而感到困惑,甚至很多时候对此失去了信心。怎么避免数据治理这些问题?……查看详情

    发布时间:2018.12.10来源:CSDN浏览量:260次

  • 数据资产管理催动数据价值加快释放

    数据资产管理催动数据价值加快释放

    12月10日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会联合举办的“2019数据资产管理大会”在京召开。多位大数据行业专家……查看详情

    发布时间:2020.03.26来源:知乎浏览量:171次

  • 如何数据标准应对这些难题

    如何数据标准应对这些难题

    应对数据标准这些难题,最经济、最理想的模式当然是:做大数据建设,首先做标准,再做大数据平台,数据仓库等。但一般的不大可能有这样的认识,很……查看详情

    发布时间:2020.11.13来源:知乎浏览量:189次

  • 云管理与云治理

    云管理与云治理

    混合云或多云已成为当今组织IT战略的重要组成部分。作为多云战略的一部分,组织需要定义如何在多个云中管理,控制,操作,优化和保护云基础架构……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:258次

  • 数据治理是一种数据管理概念-维基百科

    数据治理是一种数据管理概念-维基百科

    数据治理是一种数据管理概念,涉及使组织能够确保在数据的整个生命周期中存在高数据质量的能力。数据治理的关键重点领域包括可用性,可用性,一致……查看详情

    发布时间:2018.11.12来源:维基百科浏览量:191次

  • 2019年大数据发展将走向何方

    2019年大数据发展将走向何方

    近日,包括CCF(中国计算机学会)大数据专家委员会、IDC公司(Internet Data Center 互联网数据中心)和Gartne……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:157次

  • 数据是超乎想象的商业资产 - 这就是为什么(以及在哪里)

    数据是超乎想象的商业资产 - 这就是为什么(以及在哪里)

    说数据是商业资产几乎变得尴尬,应该被视为一个(信息也是如此)。 “数据是资产”或“数据是商业资产”消息并不新鲜。它可以追溯到二十年……查看详情

    发布时间:2018.12.20来源:数据治理浏览量:177次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议