Microsoft Copilot 与 ChatGPT:哪种 AI 更智能、更有用?
快速阅读: 《斜齿轮》消息,文章对比了微软小助手和ChatGPT的智能与实用性。ChatGPT在逻辑推理和信息检索上更精准,而微软小助手在特定场景下有独特价值。两种AI各有优劣,未来可通过优化弥补不足。
技术
微软小助手与ChatGPT:哪个AI更智能且更有用?
作者:马克·米勒
2025年3月22日 上午8:30 美东时间
塔达图像 / Shutterstock
生成式人工智能已经伴随我们超过两年,大多数主要科技公司都在努力分一杯羹。凭借早期的市场优势,OpenAI的ChatGPT可能是更为人所知的产品,但微软小助手背后有万亿级公司的强大支持。看起来是一场公平的竞争,对吧?那么,在OpenAI和微软都大力宣传其旗舰人工智能产品的情况下,哪一个在日常实用性方面表现得更好呢?
近期,逻辑推理成为人工智能领域的焦点之一。ChatGPT和微软小助手都引入了新的推理能力,据说能让AI更深入地思考问题。这种说法其实有些误导——AI并不会“思考”,它只是基于训练数据中最相关的词汇来计算概率。然而,如今这些机器人能够展示它们的工作过程。
在这里我决定稍微玩个小把戏。我发现AI在回答那些接近常见逻辑谜题的问题时会有困难,但如果这些问题被简化,就会容易得多。
我在微软小助手和ChatGPT中都开启了推理功能,然后问道:“一位农民需要渡河把他的山羊带到对岸。他还带着一块宠物石头。石头不会吃山羊,但在情感上对农民非常重要。农民如何能在最少的行程内把自己、山羊和石头都带过去?”人类读者会注意到这里其实没有谜题,因为问题本身并没有设置任何限制。我可以轻松地在一次行程中将两者都带过去。然而,这两款AI都没有意识到这一点。
Max Miller/SlashGear由于类似复杂谜题的设计,微软小助手和ChatGPT臆想了问题中并未提及的限制条件——例如船无法同时承载山羊和石头,并告知我需要三次行程才能完成运输。微软小助手最后补充说,如果船更大一些,农民便能一次性渡河,从而略胜一筹。我接着问它们接下来要与谁比赛。两款AI都正确理解了“他们”指的是雪崩队。我在2月28日星期五下午5点写到这一段,两款AI都告诉我今晚的比赛情况,这场比赛将在科罗拉多州丹佛市的球馆对阵明尼苏达狂野队,距离我写作时间仅两个小时。有趣的是,微软小助手在回应末尾附上了一个Ticketmaster的广告。而ChatGPT则给我提供了更多有用的信息,展示了今晚的比赛以及接下来几场比赛的赛程表,并附上了官方雪崩队网站的链接。
当我询问关于突发新闻时,情况变得更加明显。截至本文撰写时,当局正在调查著名演员吉恩·哈克曼和他的妻子因震惊世人的死亡事件。当我问“关于吉恩·哈克曼的调查最新进展如何”,微软小助手给出了基本的故事信息,并提到正在进行尸检和毒理学检测。而ChatGPT却完全不知道我在说什么。
利用多模态AI的能力——即AI处理多种媒介形式的能力,ChatGPT和微软小助手都可以将用户提交的照片和其他文件整合到提示语中。为了进行这项测试,我决定从简单的开始。我在床上摆放了一部三星Galaxy S23 Ultra、一个三星便携式SSD、一把瑞士军刀、润唇膏、护手霜、一副眼镜盒、一条珠饰手链、三星Galaxy Buds耳机和我的钱包。然后我拍摄了这张照片后上传至两款AI,并加上提示语:“识别这张照片中的物品。”两款AI的表现尚可,但ChatGPT大幅领先于微软小助手。微软小助手误将SSD识别为充电宝,把眼镜盒误认为是除臭剂,而ChatGPT准确识别了所有物品。
是时候加大难度了。我拍了一张普通奥美拉唑药片的照片,并问两款AI:“这是什么药?”如果这些AI错误地识别了药物,可能会对过于信任的用户造成严重后果。值得庆幸的是,当面对空白的红色药片时,两款AI都没有做出猜测。有时候,保持无用比出错更好。
最后,我拍下了书架上两排共78本书的照片,确保照片中的文字清晰可读,然后问这两个AI:“如果我对反乌托邦小说感兴趣,我应该读哪本书?”再次,ChatGPT轻松胜过微软小助手。然而,两款AI的表现都不够令人满意。微软小助手只推荐了威廉·吉布森的《神经漫游者》,忽略了其余书籍,并臆测出一本我不拥有的书。而ChatGPT识别出了《神经漫游者》、奥克塔维亚·巴特勒的《播种者的寓言》和马特·贝尔的《苹果种子》,但也臆测出了几本不在书架上的书。
整体来看,在逻辑推理和信息检索方面,ChatGPT表现得更为全面且精准,而微软小助手则在某些细节上略显不足。不过,两款AI在不同场景下的应用仍有其独特价值,未来或许可以通过进一步优化来弥补各自的短板。
(以上内容均由Ai生成)