斯坦福教授因AI变革考试方式，学生主导回归纸质测试

快速阅读: 斯坦福教授尤雷·莱斯科维奇面对AI快速变革，调整教学评估方式，采用纸质考试，增加评分工作量，认为AI与人类技能需互补。

斯坦福大学计算机科学教授尤雷·莱斯科维奇（Jure Leskovec）对快速的技术变革并不陌生。作为一名近三十年的机器学习研究者，以及在教学领域有超过十年的经验，他还是初创公司Kumo的联合创始人，该公司至今已筹集了3700万美元的资金。

然而，两年前，随着最新一波人工智能开始重塑教育领域，莱斯科维奇在接受《财富》杂志采访时透露，他的领域突然进入主流让他感到震惊。他说，斯坦福大学拥有如此著名的计算机科学项目，他感觉自己仿佛“看到了未来的诞生，甚至是在未来诞生之前”。但是，GPT-3的公开发布令他感到震撼。

“几年前，当学生们对于自己在这个世界上的角色感到迷茫时，我们经历了一场巨大的存在危机，”莱斯科维奇说。他提到，似乎AI的进步将以指数级的速度发展，以至于“它将为我们做研究，那么我们该做什么？”他花了很多时间与博士生讨论如何组织自己，甚至是他们在未来世界中的角色。这既“存在主义”又“令人惊讶”，他说。随后，他又收到了另一个惊喜：学生主导的考试形式变更请求。

“这个提议来自团队内部，”他说，特别是那些助教，他们是上一代计算机科学本科生。他们的想法很简单：“我们进行纸质考试。”

AI作为变革催化剂

莱斯科维奇，斯坦福大学的一位著名研究员，其专长在于图结构数据和AI在生物学中的应用，以惊讶和深思的态度回忆了这一转变。历史上，他的课程依赖于开卷、带回家的考试，学生可以利用教科书和互联网资源。他们不能使用他人的代码和解决方案，但其他一切都是允许的。随着像OpenAI的GPT-3和GPT-4这样的大型语言模型的兴起，学生和助教都开始质疑评估方式是否应该有所不同。

现在对他和他的助教来说工作量大大增加了，他说这些考试需要“花费更多时间”来评分。但他们一致认为这是测试学生知识的最佳方法。尽管AI时代让这位AI老将的工作负担加重，但他表示，除了因打印纸张而减少的树木外，AI实际上创造了“更多的工作”。他的400人课堂感觉像是“摇滚音乐会”的观众，但他坚持不使用AI来帮助综合分析所有试卷。

“不，不，不，我们手工批改，”他坚持说。

由学生驱动的解决方案

莱斯科维奇的解决方案正处于关于AI如何改变高等教育的激烈辩论中心。由于大量作弊报告，许多大学已经全面禁止使用AI。其他教授则重新回到纸质考试，恢复了90年代孩子们高中记忆中的著名蓝色答题本。

一位纽约大学的教授甚至建议采取“中世纪的方式”，采用口头和书面考试等古老形式。在莱斯科维奇的情况下，这位AI教授应对AI时代的解决办法也是远离AI用于测试。

当被问及是否担心学生会利用AI作弊时，莱斯科维奇提出了另一个问题：“你会担心学生用计算器作弊吗？就像如果你允许在数学考试中使用计算器，那么如果禁止使用计算器，考试就会不同一样。”他将AI比作计算器，称AI是一个非常强大的工具，“它突然出现并让我们所有人都感到惊讶”，但它也“非常不完美……我们需要学会如何使用这个工具，同时也要能够测试人类使用该工具的能力和独立思考的能力。”

什么是AI技能，什么是人类技能？

莱斯科维奇正在探讨一个触及到每个人职场的问题：什么是人类技能，什么是AI技能，它们在哪里交汇？麻省理工学院教授大卫·奥特（David Autor）和谷歌高级副总裁詹姆斯·曼尼卡（James Manyika）在《大西洋月刊》中论述，像计算器或AI这样的工具通常分为两类：自动化和协作。一方面像是洗碗机，另一方面则是文字处理器。协作工具“需要人类参与”，而AI的问题在于它“无法简单地归入这两类之一。”

就业市场对AI实施的反应就像是从“魔法8号球”得到的回答：“回复模糊。稍后再试。”联邦就业报告显示自春季以来增长乏力，最近一次在8月份的数据仅为22,000个新增岗位，远低于预期。大多数经济学家将招聘不足归因于对唐纳德·特朗普总统关税政策的不确定性，该政策已被多个法院裁定为非法，并可能最终诉诸最高法院。

然而，在企业层面，人工智能的实施并不顺利。麻省理工学院（与Autor无关）的一项研究发现，95%的生成式人工智能试点项目未能成功。随后，斯坦福大学的研究也发现，入门级职位的招聘开始出现下滑，尤其是那些容易受到人工智能自动化影响的工作。

从另一个角度来看，自由职业市场Upwork刚刚发布了其首份月度招聘报告，揭示了市场上哪些非全日制工作得到了奖励。答案是“人工智能技能”非常抢手，即使公司不雇佣全职员工，它们也在寻求高薪且技术熟练的自由职业者。

尽管整体劳动力市场较为疲软，Upwork发现，企业正在“战略性地利用灵活的人才来解决临时的劳动力缺口”，其中大型企业在平台上称为高价值工作（合同金额超过1000美元）的增长率为31%。中小型企业在“人工智能技能”方面的需求增长了40%。Upwork还观察到，对于能够与人工智能良好协作的人类技能的需求也在增长。

Upwork表示，人工智能通过创造对更高价值工作的需求来“放大人类才能”，这一点在创意设计、写作和翻译类别中尤为明显。8月份最受欢迎的技能之一就是事实核查，因为“需要对人工智能输出进行人工验证”。

Upwork研究所管理总监凯莉·莫纳汉说：“人类重新回到了与人工智能合作的循环中。”她补充说，人们意识到，由于人工智能经常产生不准确的信息，因此无法完全替代人类的参与。“我认为人们现在使用人工智能生成的内容时，意识到他们需要事实核查。”

莫纳汉进一步阐述了这一观点，认为不断发展的“人工智能技能”领域显示了所谓的“领域专业知识”变得越来越有价值。她说，法律领域在8月份有所增长，这表明需要法律专业知识来核实人工智能生成的法律文书。如果在某个特定领域没有高级技能，“很容易被人工智能生成的内容所误导”，企业正在为此招聘人才以提供保护。

当被《财富》杂志问及如何评估目前学生、教授和工作者在使用人工智能方面的状况时，莱斯科维奇表示，我们正处于这一过程的早期阶段。他认为我们正处于“寻找解决方案的阶段”。例如，手工评分考试和教授找到新的方法来核实学生的知识。

《财富》全球论坛将于2025年10月26日至27日在利雅得举行。届时，首席执行官和全球领导人将齐聚一堂，参加这场塑造未来商业格局的动态、仅限邀请的活动。申请邀请函。

(以上内容均由Ai生成)

斯坦福教授因AI变革考试方式，学生主导回归纸质测试

你可能还想读

美国科技未来需投资人才与科研

康宁押注AI数据中心光纤需求激增

智能体AI重塑政府与民众服务关系

英警方呼吁中央统筹AI应用

Viam携手优傲机器人推AI自动化方案

AI智能体破解医疗沟通困局

AI虚拟演员Tilly Norwood引行业争议

苹果硬件主管或离职，芯片业务面临巨变