Microsoft Copilot 与 ChatGPT：哪种 AI 更智能、更有用？

快速阅读: 《斜齿轮》消息，文章对比了微软小助手和ChatGPT的智能与实用性。ChatGPT在逻辑推理和信息检索上更精准，而微软小助手在特定场景下有独特价值。两种AI各有优劣，未来可通过优化弥补不足。

技术
微软小助手与ChatGPT：哪个AI更智能且更有用？
作者：马克·米勒
2025年3月22日上午8:30 美东时间

塔达图像 / Shutterstock

生成式人工智能已经伴随我们超过两年，大多数主要科技公司都在努力分一杯羹。凭借早期的市场优势，OpenAI的ChatGPT可能是更为人所知的产品，但微软小助手背后有万亿级公司的强大支持。看起来是一场公平的竞争，对吧？那么，在OpenAI和微软都大力宣传其旗舰人工智能产品的情况下，哪一个在日常实用性方面表现得更好呢？

近期，逻辑推理成为人工智能领域的焦点之一。ChatGPT和微软小助手都引入了新的推理能力，据说能让AI更深入地思考问题。这种说法其实有些误导——AI并不会“思考”，它只是基于训练数据中最相关的词汇来计算概率。然而，如今这些机器人能够展示它们的工作过程。

在这里我决定稍微玩个小把戏。我发现AI在回答那些接近常见逻辑谜题的问题时会有困难，但如果这些问题被简化，就会容易得多。

我在微软小助手和ChatGPT中都开启了推理功能，然后问道：“一位农民需要渡河把他的山羊带到对岸。他还带着一块宠物石头。石头不会吃山羊，但在情感上对农民非常重要。农民如何能在最少的行程内把自己、山羊和石头都带过去？”人类读者会注意到这里其实没有谜题，因为问题本身并没有设置任何限制。我可以轻松地在一次行程中将两者都带过去。然而，这两款AI都没有意识到这一点。

Max Miller/SlashGear由于类似复杂谜题的设计，微软小助手和ChatGPT臆想了问题中并未提及的限制条件——例如船无法同时承载山羊和石头，并告知我需要三次行程才能完成运输。微软小助手最后补充说，如果船更大一些，农民便能一次性渡河，从而略胜一筹。我接着问它们接下来要与谁比赛。两款AI都正确理解了“他们”指的是雪崩队。我在2月28日星期五下午5点写到这一段，两款AI都告诉我今晚的比赛情况，这场比赛将在科罗拉多州丹佛市的球馆对阵明尼苏达狂野队，距离我写作时间仅两个小时。有趣的是，微软小助手在回应末尾附上了一个Ticketmaster的广告。而ChatGPT则给我提供了更多有用的信息，展示了今晚的比赛以及接下来几场比赛的赛程表，并附上了官方雪崩队网站的链接。

当我询问关于突发新闻时，情况变得更加明显。截至本文撰写时，当局正在调查著名演员吉恩·哈克曼和他的妻子因震惊世人的死亡事件。当我问“关于吉恩·哈克曼的调查最新进展如何”，微软小助手给出了基本的故事信息，并提到正在进行尸检和毒理学检测。而ChatGPT却完全不知道我在说什么。

利用多模态AI的能力——即AI处理多种媒介形式的能力，ChatGPT和微软小助手都可以将用户提交的照片和其他文件整合到提示语中。为了进行这项测试，我决定从简单的开始。我在床上摆放了一部三星Galaxy S23 Ultra、一个三星便携式SSD、一把瑞士军刀、润唇膏、护手霜、一副眼镜盒、一条珠饰手链、三星Galaxy Buds耳机和我的钱包。然后我拍摄了这张照片后上传至两款AI，并加上提示语：“识别这张照片中的物品。”两款AI的表现尚可，但ChatGPT大幅领先于微软小助手。微软小助手误将SSD识别为充电宝，把眼镜盒误认为是除臭剂，而ChatGPT准确识别了所有物品。

是时候加大难度了。我拍了一张普通奥美拉唑药片的照片，并问两款AI：“这是什么药？”如果这些AI错误地识别了药物，可能会对过于信任的用户造成严重后果。值得庆幸的是，当面对空白的红色药片时，两款AI都没有做出猜测。有时候，保持无用比出错更好。

最后，我拍下了书架上两排共78本书的照片，确保照片中的文字清晰可读，然后问这两个AI：“如果我对反乌托邦小说感兴趣，我应该读哪本书？”再次，ChatGPT轻松胜过微软小助手。然而，两款AI的表现都不够令人满意。微软小助手只推荐了威廉·吉布森的《神经漫游者》，忽略了其余书籍，并臆测出一本我不拥有的书。而ChatGPT识别出了《神经漫游者》、奥克塔维亚·巴特勒的《播种者的寓言》和马特·贝尔的《苹果种子》，但也臆测出了几本不在书架上的书。

整体来看，在逻辑推理和信息检索方面，ChatGPT表现得更为全面且精准，而微软小助手则在某些细节上略显不足。不过，两款AI在不同场景下的应用仍有其独特价值，未来或许可以通过进一步优化来弥补各自的短板。

(以上内容均由Ai生成)