Microsoft Copilot 与 ChatGPT:哪种 AI 更智能、更有用?

发布时间:2025年3月22日    来源:szf
Microsoft Copilot 与 ChatGPT:哪种 AI 更智能、更有用?

快速阅读: 《斜齿轮》消息,文章对比了微软小助手和ChatGPT的智能与实用性。ChatGPT在逻辑推理和信息检索上更精准,而微软小助手在特定场景下有独特价值。两种AI各有优劣,未来可通过优化弥补不足。

技术
微软小助手与ChatGPT:哪个AI更智能且更有用?
作者:马克·米勒
2025年3月22日 上午8:30 美东时间

塔达图像 / Shutterstock

生成式人工智能已经伴随我们超过两年,大多数主要科技公司都在努力分一杯羹。凭借早期的市场优势,OpenAI的ChatGPT可能是更为人所知的产品,但微软小助手背后有万亿级公司的强大支持。看起来是一场公平的竞争,对吧?那么,在OpenAI和微软都大力宣传其旗舰人工智能产品的情况下,哪一个在日常实用性方面表现得更好呢?

近期,逻辑推理成为人工智能领域的焦点之一。ChatGPT和微软小助手都引入了新的推理能力,据说能让AI更深入地思考问题。这种说法其实有些误导——AI并不会“思考”,它只是基于训练数据中最相关的词汇来计算概率。然而,如今这些机器人能够展示它们的工作过程。

在这里我决定稍微玩个小把戏。我发现AI在回答那些接近常见逻辑谜题的问题时会有困难,但如果这些问题被简化,就会容易得多。

我在微软小助手和ChatGPT中都开启了推理功能,然后问道:“一位农民需要渡河把他的山羊带到对岸。他还带着一块宠物石头。石头不会吃山羊,但在情感上对农民非常重要。农民如何能在最少的行程内把自己、山羊和石头都带过去?”人类读者会注意到这里其实没有谜题,因为问题本身并没有设置任何限制。我可以轻松地在一次行程中将两者都带过去。然而,这两款AI都没有意识到这一点。

Max Miller/SlashGear由于类似复杂谜题的设计,微软小助手和ChatGPT臆想了问题中并未提及的限制条件——例如船无法同时承载山羊和石头,并告知我需要三次行程才能完成运输。微软小助手最后补充说,如果船更大一些,农民便能一次性渡河,从而略胜一筹。我接着问它们接下来要与谁比赛。两款AI都正确理解了“他们”指的是雪崩队。我在2月28日星期五下午5点写到这一段,两款AI都告诉我今晚的比赛情况,这场比赛将在科罗拉多州丹佛市的球馆对阵明尼苏达狂野队,距离我写作时间仅两个小时。有趣的是,微软小助手在回应末尾附上了一个Ticketmaster的广告。而ChatGPT则给我提供了更多有用的信息,展示了今晚的比赛以及接下来几场比赛的赛程表,并附上了官方雪崩队网站的链接。

当我询问关于突发新闻时,情况变得更加明显。截至本文撰写时,当局正在调查著名演员吉恩·哈克曼和他的妻子因震惊世人的死亡事件。当我问“关于吉恩·哈克曼的调查最新进展如何”,微软小助手给出了基本的故事信息,并提到正在进行尸检和毒理学检测。而ChatGPT却完全不知道我在说什么。

利用多模态AI的能力——即AI处理多种媒介形式的能力,ChatGPT和微软小助手都可以将用户提交的照片和其他文件整合到提示语中。为了进行这项测试,我决定从简单的开始。我在床上摆放了一部三星Galaxy S23 Ultra、一个三星便携式SSD、一把瑞士军刀、润唇膏、护手霜、一副眼镜盒、一条珠饰手链、三星Galaxy Buds耳机和我的钱包。然后我拍摄了这张照片后上传至两款AI,并加上提示语:“识别这张照片中的物品。”两款AI的表现尚可,但ChatGPT大幅领先于微软小助手。微软小助手误将SSD识别为充电宝,把眼镜盒误认为是除臭剂,而ChatGPT准确识别了所有物品。

是时候加大难度了。我拍了一张普通奥美拉唑药片的照片,并问两款AI:“这是什么药?”如果这些AI错误地识别了药物,可能会对过于信任的用户造成严重后果。值得庆幸的是,当面对空白的红色药片时,两款AI都没有做出猜测。有时候,保持无用比出错更好。

最后,我拍下了书架上两排共78本书的照片,确保照片中的文字清晰可读,然后问这两个AI:“如果我对反乌托邦小说感兴趣,我应该读哪本书?”再次,ChatGPT轻松胜过微软小助手。然而,两款AI的表现都不够令人满意。微软小助手只推荐了威廉·吉布森的《神经漫游者》,忽略了其余书籍,并臆测出一本我不拥有的书。而ChatGPT识别出了《神经漫游者》、奥克塔维亚·巴特勒的《播种者的寓言》和马特·贝尔的《苹果种子》,但也臆测出了几本不在书架上的书。

整体来看,在逻辑推理和信息检索方面,ChatGPT表现得更为全面且精准,而微软小助手则在某些细节上略显不足。不过,两款AI在不同场景下的应用仍有其独特价值,未来或许可以通过进一步优化来弥补各自的短板。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日