OpenAI系统在ICPC总决赛中全解12题,超越谷歌DeepMind
快速阅读: OpenAI系统在2025年ICPC总决赛中全解12题,超越人类选手及DeepMind,展现复杂推理能力。系统融合GPT-5与实验模型,未特别调整即获胜,彰显AI进步。
在2025年的国际大学生程序设计竞赛(ICPC)世界总决赛上,OpenAI 的系统表现出色,成功解决了所有12个编程问题,超越了人类选手和谷歌的 DeepMind 模型。据 OpenAI 称,如果该系统以人类团队的身份参赛,无疑将赢得第一名。
图源备注:图片由AI生成,图片授权服务商Midjourney。OpenAI 表示,该系统在比赛中遵循与学生相同的规则,通过标准的 PDF 文件接收问题集,并在五小时的时间限制内提交解决方案。所有提交均直接送交官方评审,与人类参赛队伍的解答同步评估。公司强调,在比赛期间未对该系统进行特别调整。
谷歌 DeepMind 随后宣布,其升级版的 Gemini2.5 Deep Think 系统在同一比赛中达到金牌水平,成功解决了12个问题中的10个,包括人类队伍未能解决的 C 问题。然而,Gemini 在另外两个问题上未能成功。相比之下,OpenAI 的系统以12/12的成绩完美超越了 DeepMind。
OpenAI 解释说,该系统由多个通用推理模型组成,这些模型并未特别针对 ICPC 进行训练。它使用了 GPT-5 和一个内部实验性推理模型。GPT-5 为12个问题中的11个提供了正确答案,而实验性模型负责选择最终提交的答案。最后一个也是最难的问题由实验模型独立解决,经过9次提交后最终被接受。相比之下,最佳的人类团队解决了11个问题。
OpenAI 强调,这次胜利证明了更复杂模型在深度推理和长时间计算能力方面的潜力。GPT-5 承担了大部分工作,凸显了它作为当前公众可用最强 AI 模型之一的地位。公司认为这一成就是持续进步的结果。这些模型已在国际数学奥林匹克和国际信息学奥林匹克等重要学术比赛中获得金级成绩。项目参与者穆斯塔法·罗哈尼贾德表示,ICPC 的表现是对这一成功系列的恰当总结,显示了系统的多功能性。他还补充说,下一步是开发能够发现新知识的系统,这被视为一个真正的里程碑。
划重点:
🏆 OpenAI 的系统在2025年 ICPC 总决赛中完美解决所有12个问题,超越人类和谷歌 DeepMind。
🤖 系统结合了 GPT-5 和一个实验性模型,展现了其在复杂推理任务中的优势。
📈 OpenAI 将此胜利视为 AI 能力提升的标志,未来将继续探索新知识的发现。
(以上内容均由Ai生成)