谷歌Gemini AI在国际数学奥赛测试中夺金
快速阅读: 相关媒体消息,7月22日,OpenAI和谷歌使用AI模型参加IMO竞赛。OpenAI模型获金牌,Gemini Deep Think解决五题,达金牌水平。双方均采用强化学习与推理技术提升表现。
据IT之家报道,7月22日,国际数学奥林匹克竞赛(IMO)迎来了一项新的挑战。今年,OpenAI和谷歌分别使用其最新的人工智能模型参加了这一全球顶尖的数学竞赛。
上周末,OpenAI宣布其实验性推理语言模型在2025年IMO的题目测试中取得了金牌级别的成绩。该模型在与学生相同的规则下进行了测试,需在两场各4.5小时的考试中完成题目解答,且不能使用任何工具或联网,最终还需以自然语言形式书写证明过程。
今日,谷歌也宣布其升级版的Gemini Deep Think成功解决了IMO六道题目中的五道,同样达到了金牌水平的表现。这一升级版的Gemini Deep Think采用了谷歌DeepMind最新研究成果中的改进推理模式,包括并行思维技术,使其能够同时探索多种解决方案,而不再局限于逐一尝试。
谷歌DeepMind团队表示:“为了充分发挥Deep Think的推理能力,我们利用了新颖的强化学习技术,进一步增强了模型的多步推理、问题解决和定理证明能力。此外,我们还为Gemini提供了高质量数学问题解决方案的精选语料库,并在其指令中添加了一些关于如何应对IMO问题的通用提示词和技巧。”谷歌计划在未来不久将这一升级版的Deep Think模型提供给一组受信任的测试者进行试用,并将在后续向谷歌AI Ultra订阅用户开放使用权限。
(以上内容均由AI生成)