机器学习技术正在改变机构理解学生反馈的方式
快速阅读: 据《旺赫》最新报道,高校通过AI分析学生反馈,快速理解数据背后的“为什么”,促进教学改进。学生声音AI利用机器学习处理大规模定性数据,按主题和情感分类,消除偏见并提供可视化的聚合分析。这种方法帮助高校更快响应学生需求,推动教育质量提升。
高校花费大量时间向学生收集关于学习体验的反馈意见,但一旦统计数据处理完成,难点就在于理解“为什么”。
高校收集的定性信息是深入了解反馈数据背后情感和具体经历的重要资源。当学生表现特别积极时,了解背后的原因有助于推广优秀实践;而当学生对某些方面给予负面评价时,则需要明确了解被感知的差距、遗漏或不公之处,以便加以修正。
高校花费大量时间向学生收集关于学习体验的反馈意见,但一旦统计数据处理完成,难点就在于理解“为什么”。
任何尽职的模块负责人在查看模块反馈调查中的学生评论时都会快速浏览一遍——但一旦开始从单个模块扩展到整个项目或年级层面,或者像NSS、PRES或PTES这样的大规模调查时,定性数据的数量就会让裸眼难以承受。即便最认真的阅读者也可能逐渐受到偏见影响,因为有趣或意外的评论往往被认为更具解释力,而看似普通的评论则容易被忽视。
传统的定性数据分析方法需要有人——理想情况下是多个人——手动将评论分解为可以按主题和情感编码的子句或陈述。这种方法虽可靠,但耗时严重。对于旨在快速响应反馈并改进的学生调查工作而言,这种详尽的方法很少成为标准做法。尤其是在资源日益紧张的情况下,投入大量时间进行此类细致方法学工作通常并非优先考虑。
任何尽职的模块负责人在查看模块反馈调查中的学生评论时都会快速浏览一遍——但一旦开始从单个模块扩展到整个项目或年级层面,或者像NSS、PRES或PTES这样的大规模调查时,定性数据的数量就会让裸眼难以承受。即便最认真的阅读者也可能逐渐受到偏见影响,因为有趣或意外的评论往往被认为更具解释力,而看似普通的评论则容易被忽视。
这就是机器学习技术真正发挥作用之处。
**学生声音AI**
由斯特拉斯克莱德大学(现任职于格拉斯哥大学)的学者斯图尔特·格雷创立,最初旨在帮助分析大型工程课程的学生评论。通过与Advance HE合作,他得以利用全国性的PTES和PRES数据集训练机器学习模型。现在,进一步使用NSS数据训练算法后,学生声音AI为签约高校提供当日分析学生评论的服务。
只要提到“人工智能”和“学生反馈”,有些人就会立即产生抵触情绪。因此,斯图尔特花了很多时间解释分析是如何工作的。他用以描述学生声音AI所使用的机器学习版本的术语是“监督学习”——人类手动标记数据集中的类别,并教会机器关于情感和主题的知识。可用数据集越大,机器接触到的示例就越多,其能力也越强。通过这一过程,学生声音AI确定了针对在校生和研究生研究学生的评论主题和类别,这些类别涵盖了大多数学生评论的一致内容,并且专门针对英国高等教育学生数据进行了训练。斯图尔特补充说,这些类别是可以并且确实会演变的:
“这些类别基于学生实际所说的内容,而非我们假设他们可能讨论的内容。如果有需要,可以增加更多类别,但关键在于普通人能否轻松理解。”
实际上这意味着高校可以看到学生评论的定量表示,按类别和情感维度分类。例如,你可以查看学生对反馈的看法,并总体上观察到正面、中性和负面情感的比例,然后按院系、学科领域或年级细分,点击相关评论以了解哪些因素推动了这些反馈。这与将学生评论导入第三方生成式AI平台并要求其总结完全不同。节省时间和精力的价值显而易见,但也在于消除了个人主观倾向的影响,以及为系统内不同利益相关方提供聚合与细分的可能性。此外,还可以跨机构比较学生的定性反馈。
目前,学生声音AI正与学生洞察平台evasys合作,将机器学习技术引入通过evasys平台收集的定性数据。同时,evasys和学生声音AI受Advance HE委托,对2025年PRES和PTES调查中的开放评论进行编码和分析——这为深入挖掘一个可以按学科领域、主题以及机构细分的国家级数据集创造了机会。
evasys总经理布鲁斯·约翰逊对这项技术推动文化变革的潜力充满热情,特别是在如何利用学生反馈来指导各机构的见解和行动方面:
“当你思考如何从调查数据中创造可操作的洞见时,关键问题是,面向谁?是模块负责人?还是模块组的项目总监?是系主任、副校长还是规划或质量团队?所有这些都是完全不同的利益相关方,他们需要以不同的方式看待数据。这也关乎数据的呈现方式——我的多数客户不仅需要高质量的洞见,还需要以视觉吸引的方式获取这些洞见。”
“来自高等教育领域,显然不同的利益相关者对学生的反馈数据有着不同的用途,”斯图尔特·格雷说道。“一线教师更关注学生参与度;在战略层面,则是对趋势和情感分析感兴趣。此外,还有专业服务中的多个利益相关者群体,他们通常看不到这些信息,但我们可以通过生成报告展示给他们。很多时候,数据告诉他们的内容他们早已知晓,但这为他们提供了推动变革的依据。”
“结果已经揭晓,”贝尔法斯特女王大学的学生调查官员邓肯·贝里曼总结了人工智能分析对其团队的价值:“这让我们工作轻松了许多,学校也能更快获取数据和趋势。”此前,学校收到的是Excel电子表格,他的团队花了大量时间向同事解释如何理解这些数据。能够直观地看到学生在各主题上的态度可视化呈现,意味着,正如邓肯略带讽刺地指出的那样,“如果变化没有发生,那不仅仅是因为人们不知道学生调查说了什么。”
伦敦大学学院经济学教授兼副校长(学生学术体验)帕拉玛·乔杜里解释了定性数据分析在整个教学质量提升体系中的位置。在她看来,为了提升质量,将你的定量学生反馈分数与另一个系进行比较并不是特别有用——本质上是在比较苹果和橙子。然而,定量数据的可比性看似容易,而面对学生评论的数量和复杂性带来的压力,人们往往会花时间去解释数字差异,而不是深入挖掘定性数据以寻找更有力且可行的解释来为自己的分数提供背景。换句话说,并不是人们不努力提升质量,而是他们并不总是拥有最好的信息来指导这项工作。
“当我接手这个职位时,很多人都说‘我们不明白为什么定性数据告诉我们这些,我们已经做了所有这些事情,’”帕拉玛说。“我在这一行工作了很久,也收到了不少模块评估的摘要报告,我一直质疑这些摘要,因为这只是某人的主观解读。一个经过良好训练的算法提供的客观视角确实有所不同。”
伦敦大学学院今年试行了两页的学生评论摘要给特定部门,并计划在今年夏天为每个部门推出版本。这些数据并非孤立评估;它构成更广泛的质量保障和提升体系的一部分,其中包括关于发展领域的多种不同视角的数据。令人鼓舞的是,到目前为止,学生的数据与内部审查中出现的内容一致,让有机会参与的院系对自己的流程和行动计划更有信心。但这并不妨碍任何人查看具体的学生评论、验证算法的分析和/或与其他数据进行三角验证。
在爱丁堡大学,学术规划主管玛丽安·布朗表示,人工智能分析的价值在于快速反馈机制——机构会进行人工审查流程,以确保捕捉到任何意外的评论。但能够迅速分享关键见解(在这种情况下是通过Power BI界面)意味着领导者在信息还新鲜时收到反馈,从而有更多时间进行改进,而不是因手动编码而浪费时间。爱丁堡大学以其尖端的人工智能研究闻名,并拥有爱丁堡语言模型(ELM)平台,该平台允许教职员工和学生使用生成式AI工具,同时不会与第三方共享数据,所有用户数据均保留在本地并受到保护。玛丽安明确表示,即使是像ELM这样封闭的系统也不适合不受限的学生评论分析。生成式AI工具提供了表象上的主题分析,但实际上远非稳健,因为它通过复杂的猜测而非实际数据的含义分析运行。
“能够将NSS或我们的内部学生调查回复放入ELM以生成摘要很好,直到你开始质疑这些摘要。任何输出都需经过稳健的验证,”玛丽安说。
同样,邓肯·贝里曼观察到:“如果你要求一个生成式AI工具显示与它挑选出的主题相关的评论,它不会引用实际评论。或者它可能只是从一条评论中提取出这个所谓的共同主题。”
学生调查实践的圣杯是创造一个良性循环:学生参与反馈产生可操作的数据,从而推动教育提升,学生对这一过程的真实性充满信心,进而更加积极地分享他们的反馈。在这个追求过程中,合理运用人工智能可以成为机构的盟友和资源倍增器,快速且稳健地访问聚合的学生观点和意见。
“最终目标应是改善教学和学习,”斯图尔特·格雷说道。“希望我们正在做的就是节省手动枯燥的工作时间,腾出时间来进行真正的变革。”
(以上内容均由Ai生成)