谷歌AI模型Gemini夺ICPC世界冠军,超越人类选手
快速阅读: 谷歌Gemini 2.5 Deep Think在2025年ICPC世界总决赛中获金牌,解决12题中的10题,包括一个无人类团队解决的问题。此成就标志AI技术的重大进步。
谷歌首席执行官桑达尔·皮查伊宣布其先进的人工智能模型Gemini 2.5 Deep Think取得了重大成就。该模型在2025年国际大学生程序设计竞赛(ICPC)世界总决赛上表现优异,成功解决了12个问题中的10个,获得了金牌。皮查伊在X平台上发文称:“令人难以置信的里程碑:Gemini 2.5 Deep Think的一个高级版本在ICPC世界总决赛上取得金牌成绩,这是一项顶级全球编程竞赛,它解决了12个问题中的10个。这一抽象问题解决能力的巨大飞跃值得庆祝——向@GoogleDeepMind表示祝贺!”
另一个值得注意的成就是,Gemini在30分钟内解决了一个在整个比赛中无人类团队能够解决的问题。这距离该模型在同一赛事中获得国际数学奥林匹克竞赛(IMO)金牌仅过去了两个月。虽然IMO面向高中生,但ICPC是大学级别的算法编程竞赛,来自全球103个国家近3000所大学的选手参加比赛,解决现实世界的编码挑战。
根据谷歌博客文章,Gemini 2.5 Deep Think以现场远程的方式参加了ICPC比赛,严格遵守官方规则,并在活动组织者的监督下进行。该模型比人类团队晚10分钟开始比赛,同样面临五小时的时间限制。Gemini迅速在45分钟内解决了8个问题,并在接下来的三小时内完成了另外两个问题。总计,它在677分钟的累计时间内解决了12个问题中的10个,如果与大学队伍排名比较,将位列第二。ICPC全球执行董事比尔·普彻评论道:“Gemini成功进入这一领域并取得金牌水平的成绩,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。祝贺谷歌DeepMind,这项工作将帮助我们推动一场惠及所有人的数字文艺复兴。”
谷歌解释了Gemini如何达到这一性能水平,称“通过强化学习过程,我们训练Gemini解决程序员面临的最困难的问题,从反馈结果中学习并发展其方法。”为了解决问题,多个Gemini代理提出自己的代码,运行测试,然后根据所有尝试的结果改进答案。谷歌还声称,内部测试显示,Gemini 2.5 Deep Think的这一版本在2023年和2024年的ICPC世界总决赛中也能达到金牌水平的成绩,与全球排名前20的人类编程者相当。最后,对于普通用户,谷歌指出,Gemini 2.5 Deep Think的一个轻量级版本已经通过Gemini应用程序提供给拥有Google AI Ultra订阅的用户。
(以上内容均由Ai生成)