Microsoft Copilot 在强大的 Atari 2600 视频国际象棋脚下加入 ChatGPT
快速阅读: 《The Register》消息,罗伯特·卡鲁索用微软 Copilot 再次挑战 Atair 2600 模拟器,结果 Copilot 同样失败。它无法跟踪棋盘状态,最终被 Atari 2600 击败。这揭示了 AI 聊天机器人的盲目自信与局限性。
在 Atair 2600 模拟器上让 ChatGPT 遭到羞辱后,罗伯特·卡鲁索并不满足,他再次尝试,这次是用微软的 Copilot。理论上,结果应该是一样的,Copilot 也会遭遇类似的失利。然而……如果 Copilot 在 ChatGPT 失败的地方获胜呢?“没有理由认为它会成功,”卡鲁索写道,但……“想象一下,如果一个微软产品表现优于 ChatGPT,大家都会惊掉下巴。”因此,卡鲁索启动了 Stella 模拟器,并与 Copilot 进行了赛前交谈,解释了 ChatGPT 是如何失败的。他告诉聊天机器人,ChatGPT 失败的主要原因之一是它无法跟踪棋盘状态。如果 Copilot 也遇到同样的困难,那么就没有必要继续比赛了。
带着只有人工智能聊天机器人能拥有的自信,Copilot 坚称它不仅能下棋,而且非常擅长。卡鲁索说:“它声称它可以预估 10-15 步,但觉得面对 2600 时会只走 3-5 步,因为它会做出‘次优的走法’(suboptimal moves),这样它就能‘利用这些走法,而不是执着于深入计算’。”
人类反击国际象棋 AI 系统
阅读更多
而跟踪棋盘状态呢?Copilot 自夸道:“我会努力记住之前的棋步并保持游戏连贯性,所以我们的比赛应该会更顺畅。”Copilot 承认自己和 ChatGPT 一样存在空间记忆障碍,但它表示可以分析当前棋盘并选择好的走法。卡鲁索需要在 Atari 移动后给聊天机器人一张棋盘截图,并手动将 Copilot 的走法输入 Video Chess。
比赛正式开始!
现在,任何有今天生成式人工智能系统经验的人都知道会发生什么。Copilot 的自负是错误的。它的走法……非常奇特,但最终它失去了两个兵、一个马和一个象,而强大的 Atari 2600 Video Chess 只损失了一个兵。最后,卡鲁索要求 Copilot 将其认为的棋盘状态与他最后一次粘贴的截图进行比较,聊天机器人承认两者不同。
卡鲁索声称 Atari 2600 “彻底击败”了 ChatGPT 下国际象棋。
谷歌向贸易机构提供数百万美元以结盟对抗微软
CrowdStrike 向国会道歉,为引发全球 IT 中断的“完美风暴”
微软并不是 CISPE 的唯一潜在合作伙伴——看起来谷歌愿意为其对云许可的观点支付费用以取得优势
“ChatGPT 的重演。”
在这种不利条件下,微软的聊天机器人显然不可能赢。尽管如此,它在失败中依然优雅:“Atari 这一轮赢得了胜利。我将以尊严和荣誉向这位战胜我的老式计算机大师致敬。”
卡鲁索的实验很有趣,但也突显了人工智能聊天机器人能够毫无根据地盲目自信地胡说八道。Copilot(就像 ChatGPT 一样)可能已经接受了国际象棋基础知识的训练,但无法制定策略。问题还因它所理解的棋盘位置与现实明显不同而加剧。
这个故事的寓意是:要警惕聊天机器人的盲目自信。大型语言模型显然在某些方面表现不错。但显然,45 年前的国际象棋对弈不是其中之一。
(以上内容均由Ai生成)