OpenAI O3夺冠,AI象棋大赛展现真实棋力

发布时间:2025年8月14日    来源:szf
OpenAI O3夺冠,AI象棋大赛展现真实棋力

快速阅读: 在国际象棋锦标赛中,OpenAI的o3模型以全胜战绩夺冠,决赛中4-0击败xAI的Grok4。比赛规则要求AI未接受专门训练,仅能从互联网获取基础知识。卡尔森分析,通用AI在象棋上表现不稳定,难以实现将死目标。

在一场备受瞩目的人工智能国际象棋锦标赛中,OpenAI的o3模型展现出压倒性优势,以全胜战绩夺得冠军。这场比赛有一个特殊规则:参赛的AI模型必须在没有接受任何专门象棋训练的前提下参赛,只能在赛前从互联网获取基础的国际象棋知识。

决赛阶段,o3面对来自xAI的Grok4,最终以4-0的悬殊比分轻松获胜。更令人印象深刻的是,o3在整个锦标赛期间保持了完美记录,三场比赛均以4-0的比分获胜,甚至在半决赛中横扫了同为OpenAI开发的o4mini模型。

Grok4在进入决赛的道路上同样表现不俗,连续击败了Google的两个强劲对手——Gemini2.5Flash和Gemini2.5Pro。当时,埃隆·马斯克还颇为自信地表示,xAI团队”基本没在象棋上花功夫”,暗示Grok4的天然实力。

然而,决赛的结果让许多观察者大跌眼镜。国际象棋对弈网站Chess.com的总编辑Pedro Pinhata在赛后报道中写道:”直到半决赛,似乎没有什么能够阻止Grok4赢得比赛。但这种幻觉在比赛的最后一天破灭了。” 担任解说嘉宾的国际象棋大师中村光在直播中直言不讳地指出:”Grok在比赛中犯了很多错误,但OpenAI没有。”这个简洁的评价道出了胜负的关键。

更有趣的是世界排名 第一 的国际象棋大师芒努斯·卡尔森的点评。他表示,决赛中两个AI模型的棋力水平大约相当于刚学会规则的普通棋手,ELO等级分约为800分。作为对比,卡尔森本人的ELO达到2839分,排名第二的中村光也有2807分,两者之间的差距可谓天壤之别。

卡尔森进一步分析了这些通用AI模型在象棋方面的局限性。他发现,这些模型的表现极不稳定,棋艺时好时坏。它们在计算吃棋子方面表现尚可,但在真正将死对手这一核心目标上却显得力不从心。”它们懂得物质优势,却不懂如何取胜,”卡尔森形象地比喻道,”这就好比擅长收集食材,却不会做饭一样。” 这场比赛的结果与专门设计的象棋AI形成了鲜明对比。回顾历史,1997年击败国际象棋大师加里·卡斯帕罗夫的 超级 电脑”深蓝”,以及2016年战胜韩国围棋九段李世石的AlphaGo,都是专门为棋类游戏量身打造的程序,拥有深度的领域知识和专业训练。

事实上,通用AI模型在专业棋类领域的局限性早有先例。今年早些时候,在国际象棋大师Levy Rozman组织的另一场锦标赛中,Grok和ChatGPT都败给了专为国际象棋设计的人工智能系统Stockfish,进一步证实了通用模型与专业系统之间的实力差距。

这场AI象棋锦标赛不仅展示了当前通用人工智能模型的能力边界,也为我们理解AI在特定领域的表现提供了有价值的参考。尽管这些模型在语言理解和生成方面表现出色,但在需要深度战略思维和专业知识的领域,它们仍有很长的路要走。

(以上内容均由Ai生成)

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日