斯坦福教授因AI变革考试方式,学生主导回归纸质测试
快速阅读: 斯坦福教授尤雷·莱斯科维奇面对AI快速变革,调整教学评估方式,采用纸质考试,增加评分工作量,认为AI与人类技能需互补。
斯坦福大学计算机科学教授尤雷·莱斯科维奇(Jure Leskovec)对快速的技术变革并不陌生。作为一名近三十年的机器学习研究者,以及在教学领域有超过十年的经验,他还是初创公司Kumo的联合创始人,该公司至今已筹集了3700万美元的资金。
然而,两年前,随着最新一波人工智能开始重塑教育领域,莱斯科维奇在接受《财富》杂志采访时透露,他的领域突然进入主流让他感到震惊。他说,斯坦福大学拥有如此著名的计算机科学项目,他感觉自己仿佛“看到了未来的诞生,甚至是在未来诞生之前”。但是,GPT-3的公开发布令他感到震撼。
“几年前,当学生们对于自己在这个世界上的角色感到迷茫时,我们经历了一场巨大的存在危机,”莱斯科维奇说。他提到,似乎AI的进步将以指数级的速度发展,以至于“它将为我们做研究,那么我们该做什么?”他花了很多时间与博士生讨论如何组织自己,甚至是他们在未来世界中的角色。这既“存在主义”又“令人惊讶”,他说。随后,他又收到了另一个惊喜:学生主导的考试形式变更请求。
“这个提议来自团队内部,”他说,特别是那些助教,他们是上一代计算机科学本科生。他们的想法很简单:“我们进行纸质考试。”
AI作为变革催化剂
莱斯科维奇,斯坦福大学的一位著名研究员,其专长在于图结构数据和AI在生物学中的应用,以惊讶和深思的态度回忆了这一转变。历史上,他的课程依赖于开卷、带回家的考试,学生可以利用教科书和互联网资源。他们不能使用他人的代码和解决方案,但其他一切都是允许的。随着像OpenAI的GPT-3和GPT-4这样的大型语言模型的兴起,学生和助教都开始质疑评估方式是否应该有所不同。
现在对他和他的助教来说工作量大大增加了,他说这些考试需要“花费更多时间”来评分。但他们一致认为这是测试学生知识的最佳方法。尽管AI时代让这位AI老将的工作负担加重,但他表示,除了因打印纸张而减少的树木外,AI实际上创造了“更多的工作”。他的400人课堂感觉像是“摇滚音乐会”的观众,但他坚持不使用AI来帮助综合分析所有试卷。
“不,不,不,我们手工批改,”他坚持说。
由学生驱动的解决方案
莱斯科维奇的解决方案正处于关于AI如何改变高等教育的激烈辩论中心。由于大量作弊报告,许多大学已经全面禁止使用AI。其他教授则重新回到纸质考试,恢复了90年代孩子们高中记忆中的著名蓝色答题本。
一位纽约大学的教授甚至建议采取“中世纪的方式”,采用口头和书面考试等古老形式。在莱斯科维奇的情况下,这位AI教授应对AI时代的解决办法也是远离AI用于测试。
当被问及是否担心学生会利用AI作弊时,莱斯科维奇提出了另一个问题:“你会担心学生用计算器作弊吗?就像如果你允许在数学考试中使用计算器,那么如果禁止使用计算器,考试就会不同一样。”他将AI比作计算器,称AI是一个非常强大的工具,“它突然出现并让我们所有人都感到惊讶”,但它也“非常不完美……我们需要学会如何使用这个工具,同时也要能够测试人类使用该工具的能力和独立思考的能力。”
什么是AI技能,什么是人类技能?
莱斯科维奇正在探讨一个触及到每个人职场的问题:什么是人类技能,什么是AI技能,它们在哪里交汇?麻省理工学院教授大卫·奥特(David Autor)和谷歌高级副总裁詹姆斯·曼尼卡(James Manyika)在《大西洋月刊》中论述,像计算器或AI这样的工具通常分为两类:自动化和协作。一方面像是洗碗机,另一方面则是文字处理器。协作工具“需要人类参与”,而AI的问题在于它“无法简单地归入这两类之一。”
就业市场对AI实施的反应就像是从“魔法8号球”得到的回答:“回复模糊。稍后再试。”联邦就业报告显示自春季以来增长乏力,最近一次在8月份的数据仅为22,000个新增岗位,远低于预期。大多数经济学家将招聘不足归因于对唐纳德·特朗普总统关税政策的不确定性,该政策已被多个法院裁定为非法,并可能最终诉诸最高法院。
然而,在企业层面,人工智能的实施并不顺利。麻省理工学院(与Autor无关)的一项研究发现,95%的生成式人工智能试点项目未能成功。随后,斯坦福大学的研究也发现,入门级职位的招聘开始出现下滑,尤其是那些容易受到人工智能自动化影响的工作。
从另一个角度来看,自由职业市场Upwork刚刚发布了其首份月度招聘报告,揭示了市场上哪些非全日制工作得到了奖励。答案是“人工智能技能”非常抢手,即使公司不雇佣全职员工,它们也在寻求高薪且技术熟练的自由职业者。
尽管整体劳动力市场较为疲软,Upwork发现,企业正在“战略性地利用灵活的人才来解决临时的劳动力缺口”,其中大型企业在平台上称为高价值工作(合同金额超过1000美元)的增长率为31%。中小型企业在“人工智能技能”方面的需求增长了40%。Upwork还观察到,对于能够与人工智能良好协作的人类技能的需求也在增长。
Upwork表示,人工智能通过创造对更高价值工作的需求来“放大人类才能”,这一点在创意设计、写作和翻译类别中尤为明显。8月份最受欢迎的技能之一就是事实核查,因为“需要对人工智能输出进行人工验证”。
Upwork研究所管理总监凯莉·莫纳汉说:“人类重新回到了与人工智能合作的循环中。”她补充说,人们意识到,由于人工智能经常产生不准确的信息,因此无法完全替代人类的参与。“我认为人们现在使用人工智能生成的内容时,意识到他们需要事实核查。”
莫纳汉进一步阐述了这一观点,认为不断发展的“人工智能技能”领域显示了所谓的“领域专业知识”变得越来越有价值。她说,法律领域在8月份有所增长,这表明需要法律专业知识来核实人工智能生成的法律文书。如果在某个特定领域没有高级技能,“很容易被人工智能生成的内容所误导”,企业正在为此招聘人才以提供保护。
当被《财富》杂志问及如何评估目前学生、教授和工作者在使用人工智能方面的状况时,莱斯科维奇表示,我们正处于这一过程的早期阶段。他认为我们正处于“寻找解决方案的阶段”。例如,手工评分考试和教授找到新的方法来核实学生的知识。
《财富》全球论坛将于2025年10月26日至27日在利雅得举行。届时,首席执行官和全球领导人将齐聚一堂,参加这场塑造未来商业格局的动态、仅限邀请的活动。申请邀请函。
(以上内容均由Ai生成)