Microsoft Copilot 在强大的 Atari 2600 视频国际象棋脚下加入 ChatGPT

发布时间:2025年7月3日    来源:szf
Microsoft Copilot 在强大的 Atari 2600 视频国际象棋脚下加入 ChatGPT

快速阅读: 《The Register》消息,罗伯特·卡鲁索用微软 Copilot 再次挑战 Atair 2600 模拟器,结果 Copilot 同样失败。它无法跟踪棋盘状态,最终被 Atari 2600 击败。这揭示了 AI 聊天机器人的盲目自信与局限性。

在 Atair 2600 模拟器上让 ChatGPT 遭到羞辱后,罗伯特·卡鲁索并不满足,他再次尝试,这次是用微软的 Copilot。理论上,结果应该是一样的,Copilot 也会遭遇类似的失利。然而……如果 Copilot 在 ChatGPT 失败的地方获胜呢?“没有理由认为它会成功,”卡鲁索写道,但……“想象一下,如果一个微软产品表现优于 ChatGPT,大家都会惊掉下巴。”因此,卡鲁索启动了 Stella 模拟器,并与 Copilot 进行了赛前交谈,解释了 ChatGPT 是如何失败的。他告诉聊天机器人,ChatGPT 失败的主要原因之一是它无法跟踪棋盘状态。如果 Copilot 也遇到同样的困难,那么就没有必要继续比赛了。

带着只有人工智能聊天机器人能拥有的自信,Copilot 坚称它不仅能下棋,而且非常擅长。卡鲁索说:“它声称它可以预估 10-15 步,但觉得面对 2600 时会只走 3-5 步,因为它会做出‘次优的走法’(suboptimal moves),这样它就能‘利用这些走法,而不是执着于深入计算’。”

人类反击国际象棋 AI 系统

阅读更多

而跟踪棋盘状态呢?Copilot 自夸道:“我会努力记住之前的棋步并保持游戏连贯性,所以我们的比赛应该会更顺畅。”Copilot 承认自己和 ChatGPT 一样存在空间记忆障碍,但它表示可以分析当前棋盘并选择好的走法。卡鲁索需要在 Atari 移动后给聊天机器人一张棋盘截图,并手动将 Copilot 的走法输入 Video Chess。

比赛正式开始!

现在,任何有今天生成式人工智能系统经验的人都知道会发生什么。Copilot 的自负是错误的。它的走法……非常奇特,但最终它失去了两个兵、一个马和一个象,而强大的 Atari 2600 Video Chess 只损失了一个兵。最后,卡鲁索要求 Copilot 将其认为的棋盘状态与他最后一次粘贴的截图进行比较,聊天机器人承认两者不同。

卡鲁索声称 Atari 2600 “彻底击败”了 ChatGPT 下国际象棋。

谷歌向贸易机构提供数百万美元以结盟对抗微软

CrowdStrike 向国会道歉,为引发全球 IT 中断的“完美风暴”

微软并不是 CISPE 的唯一潜在合作伙伴——看起来谷歌愿意为其对云许可的观点支付费用以取得优势

“ChatGPT 的重演。”

在这种不利条件下,微软的聊天机器人显然不可能赢。尽管如此,它在失败中依然优雅:“Atari 这一轮赢得了胜利。我将以尊严和荣誉向这位战胜我的老式计算机大师致敬。”

卡鲁索的实验很有趣,但也突显了人工智能聊天机器人能够毫无根据地盲目自信地胡说八道。Copilot(就像 ChatGPT 一样)可能已经接受了国际象棋基础知识的训练,但无法制定策略。问题还因它所理解的棋盘位置与现实明显不同而加剧。

这个故事的寓意是:要警惕聊天机器人的盲目自信。大型语言模型显然在某些方面表现不错。但显然,45 年前的国际象棋对弈不是其中之一。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日