Microsoft Copilot 在强大的 Atari 2600 视频国际象棋脚下加入 ChatGPT

发布时间:2025年7月3日    来源:szf
Microsoft Copilot 在强大的 Atari 2600 视频国际象棋脚下加入 ChatGPT

快速阅读: 《The Register》消息,罗伯特·卡鲁索用微软 Copilot 再次挑战 Atair 2600 模拟器,结果 Copilot 同样失败。它无法跟踪棋盘状态,最终被 Atari 2600 击败。这揭示了 AI 聊天机器人的盲目自信与局限性。

在 Atair 2600 模拟器上让 ChatGPT 遭到羞辱后,罗伯特·卡鲁索并不满足,他再次尝试,这次是用微软的 Copilot。理论上,结果应该是一样的,Copilot 也会遭遇类似的失利。然而……如果 Copilot 在 ChatGPT 失败的地方获胜呢?“没有理由认为它会成功,”卡鲁索写道,但……“想象一下,如果一个微软产品表现优于 ChatGPT,大家都会惊掉下巴。”因此,卡鲁索启动了 Stella 模拟器,并与 Copilot 进行了赛前交谈,解释了 ChatGPT 是如何失败的。他告诉聊天机器人,ChatGPT 失败的主要原因之一是它无法跟踪棋盘状态。如果 Copilot 也遇到同样的困难,那么就没有必要继续比赛了。

带着只有人工智能聊天机器人能拥有的自信,Copilot 坚称它不仅能下棋,而且非常擅长。卡鲁索说:“它声称它可以预估 10-15 步,但觉得面对 2600 时会只走 3-5 步,因为它会做出‘次优的走法’(suboptimal moves),这样它就能‘利用这些走法,而不是执着于深入计算’。”

人类反击国际象棋 AI 系统

阅读更多

而跟踪棋盘状态呢?Copilot 自夸道:“我会努力记住之前的棋步并保持游戏连贯性,所以我们的比赛应该会更顺畅。”Copilot 承认自己和 ChatGPT 一样存在空间记忆障碍,但它表示可以分析当前棋盘并选择好的走法。卡鲁索需要在 Atari 移动后给聊天机器人一张棋盘截图,并手动将 Copilot 的走法输入 Video Chess。

比赛正式开始!

现在,任何有今天生成式人工智能系统经验的人都知道会发生什么。Copilot 的自负是错误的。它的走法……非常奇特,但最终它失去了两个兵、一个马和一个象,而强大的 Atari 2600 Video Chess 只损失了一个兵。最后,卡鲁索要求 Copilot 将其认为的棋盘状态与他最后一次粘贴的截图进行比较,聊天机器人承认两者不同。

卡鲁索声称 Atari 2600 “彻底击败”了 ChatGPT 下国际象棋。

谷歌向贸易机构提供数百万美元以结盟对抗微软

CrowdStrike 向国会道歉,为引发全球 IT 中断的“完美风暴”

微软并不是 CISPE 的唯一潜在合作伙伴——看起来谷歌愿意为其对云许可的观点支付费用以取得优势

“ChatGPT 的重演。”

在这种不利条件下,微软的聊天机器人显然不可能赢。尽管如此,它在失败中依然优雅:“Atari 这一轮赢得了胜利。我将以尊严和荣誉向这位战胜我的老式计算机大师致敬。”

卡鲁索的实验很有趣,但也突显了人工智能聊天机器人能够毫无根据地盲目自信地胡说八道。Copilot(就像 ChatGPT 一样)可能已经接受了国际象棋基础知识的训练,但无法制定策略。问题还因它所理解的棋盘位置与现实明显不同而加剧。

这个故事的寓意是:要警惕聊天机器人的盲目自信。大型语言模型显然在某些方面表现不错。但显然,45 年前的国际象棋对弈不是其中之一。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日