AI国际象棋大赛开赛,Grok 4领先,DeepSeek与Kimi K2紧随其后
快速阅读: 8月5日至7日,谷歌与Kaggle联合举办首届AI国际象棋赛,Grok4首日表现出色,与Gemini2.5Pro、o4-mini和o3晋级半决赛,比赛旨在测试AI决策能力。
近日,谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中,马斯克旗下的 Grok4展现了非凡的实力,成为首日比赛的 绝对 焦点。
这场比赛聚集了多款 顶尖 AI 模型,参赛选手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude Opus4和 Grok4。比赛于8月5日至7日每天下午10:30(太平洋时间)准时直播,国际象棋特级大师中村光(Hikaru Nakamura)也受邀担任解说。
首日对决中,Grok4以超凡的战术表现和快速反应获得了 最高 评价,而 DeepSeek R1虽表现强劲,但不敌 o4-mini,Kimi K2则被认为惨遭不公,网友们纷纷为其鸣冤。马斯克对此次比赛的成功表现淡定回应:“我们并没有特别训练,这只是一个副产品。” 可见,他对此次比赛的宣传价值可谓深谙其道。
虽然比赛结果引起了热议,但其真正的意义在于测试 AI 的 “涌现能力”。国际象棋以其明确的规则和高复杂度(存在约10^120种可能局面)成为了评估 AI 决策能力的理想舞台。很多网友表示,这场比赛不仅仅是输赢的较量,更是 AI 综合能力的全面展示。
经过首轮较量,Grok4与 Gemini2.5Pro、OpenAI 的 o4-mini 和 o3晋级半决赛。各对决中,Grok4如猛兽般的表现让人惊叹,而 Kimi K2的频繁违规行为则让其面临被淘汰的境地,观众对此颇有微词。尽管如此,比赛仍在继续,大家期待后续的精彩对决。
为何选择国际象棋作为 AI 对战的舞台?这主要是因为国际象棋规则清晰但战略复杂,能够有效评估 AI 的决策能力。正如网友所说,这场比赛的结果不仅是对各模型能力的检测,更是对 AI 技术的一次深度探索。
(以上内容均由Ai生成)