OpenAI O3夺冠，AI象棋大赛展现真实棋力

发布时间：2025年8月14日来源：szf

快速阅读: 在国际象棋锦标赛中，OpenAI的o3模型以全胜战绩夺冠，决赛中4-0击败xAI的Grok4。比赛规则要求AI未接受专门训练，仅能从互联网获取基础知识。卡尔森分析，通用AI在象棋上表现不稳定，难以实现将死目标。

在一场备受瞩目的人工智能国际象棋锦标赛中,OpenAI的o3模型展现出压倒性优势,以全胜战绩夺得冠军。这场比赛有一个特殊规则:参赛的AI模型必须在没有接受任何专门象棋训练的前提下参赛,只能在赛前从互联网获取基础的国际象棋知识。

决赛阶段,o3面对来自xAI的Grok4,最终以4-0的悬殊比分轻松获胜。更令人印象深刻的是,o3在整个锦标赛期间保持了完美记录,三场比赛均以4-0的比分获胜,甚至在半决赛中横扫了同为OpenAI开发的o4mini模型。

Grok4在进入决赛的道路上同样表现不俗,连续击败了Google的两个强劲对手——Gemini2.5Flash和Gemini2.5Pro。当时,埃隆·马斯克还颇为自信地表示,xAI团队”基本没在象棋上花功夫”,暗示Grok4的天然实力。

然而,决赛的结果让许多观察者大跌眼镜。国际象棋对弈网站Chess.com的总编辑Pedro Pinhata在赛后报道中写道:”直到半决赛,似乎没有什么能够阻止Grok4赢得比赛。但这种幻觉在比赛的最后一天破灭了。” 担任解说嘉宾的国际象棋大师中村光在直播中直言不讳地指出:”Grok在比赛中犯了很多错误,但OpenAI没有。”这个简洁的评价道出了胜负的关键。

更有趣的是世界排名第一的国际象棋大师芒努斯·卡尔森的点评。他表示,决赛中两个AI模型的棋力水平大约相当于刚学会规则的普通棋手,ELO等级分约为800分。作为对比,卡尔森本人的ELO达到2839分,排名第二的中村光也有2807分,两者之间的差距可谓天壤之别。

卡尔森进一步分析了这些通用AI模型在象棋方面的局限性。他发现,这些模型的表现极不稳定,棋艺时好时坏。它们在计算吃棋子方面表现尚可,但在真正将死对手这一核心目标上却显得力不从心。”它们懂得物质优势,却不懂如何取胜,”卡尔森形象地比喻道,”这就好比擅长收集食材,却不会做饭一样。” 这场比赛的结果与专门设计的象棋AI形成了鲜明对比。回顾历史,1997年击败国际象棋大师加里·卡斯帕罗夫的超级电脑”深蓝”,以及2016年战胜韩国围棋九段李世石的AlphaGo,都是专门为棋类游戏量身打造的程序,拥有深度的领域知识和专业训练。

事实上,通用AI模型在专业棋类领域的局限性早有先例。今年早些时候,在国际象棋大师Levy Rozman组织的另一场锦标赛中,Grok和ChatGPT都败给了专为国际象棋设计的人工智能系统Stockfish,进一步证实了通用模型与专业系统之间的实力差距。

这场AI象棋锦标赛不仅展示了当前通用人工智能模型的能力边界,也为我们理解AI在特定领域的表现提供了有价值的参考。尽管这些模型在语言理解和生成方面表现出色,但在需要深度战略思维和专业知识的领域,它们仍有很长的路要走。

(以上内容均由Ai生成)