为什么 GPT 不能像我们一样思考

发布时间:2025年2月22日    来源:szf
为什么 GPT 不能像我们一样思考

快速阅读: 据《科学日报》最新报道,类比推理涉及通过比较不同事物的相似性来理解和做决策。研究表明,尽管GPT模型在标准类比测试中表现良好,但在变化条件下,如数字位置改变或故事元素重写时,其表现不如人类。这表明AI更多依赖模式匹配而非深入理解,强调了AI在复杂推理任务中的局限性。研究者指出,这为教育、法律和医疗等领域的人工智能应用敲响了警钟。

类比推理是指根据两个不同事物在某些方面的相似性进行比较的能力。这是人们理解和做决定世界的一种常见方法。类比推理的一个例子:杯子之于咖啡如同碗之于(答案是:汤)。像GPT-4这样的大型语言模型在各种测试中表现出色,包括那些需要类比推理的测试。但人工智能模型能否真正进行广泛的、稳健的推理,还是过度依赖其训练数据中的模式?由语言和人工智能专家玛莎·刘易斯(阿姆斯特丹大学逻辑、语言与计算研究所)和梅兰妮·米切尔(圣塔菲研究所)进行的一项研究探讨了GPT模型是否像人类一样在类比方面具有灵活性和稳健性。“这至关重要,因为人工智能越来越多地用于现实世界的决策和问题解决,”刘易斯解释道。

将人工智能模型与人类表现进行比较

刘易斯和米切尔比较了人类和GPT模型在三种不同类型类比问题上的表现:字母序列——识别字母序列中的模式并正确完成。数字矩阵——分析数字模式并确定缺失的数字。故事类比——理解哪两个故事最符合给定示例故事。故事类比

一个真正理解类比的系统应该即使在变化的情况下也能保持高性能。该研究还考察了GPT模型在问题被微妙修改时的表现。“一个真正理解类比的系统应该即使在这些变化下也能保持高绩效,”作者在其文章中表示。

GPT模型在稳健性上存在不足

在大多数修改版本的问题上,人类保持了高水平的性能,而GPT模型虽然在标准类比问题上表现良好,但在变化面前却遇到了困难。“这表明人工智能模型往往比人类缺乏灵活性,它们的推理更多的是基于模式匹配而非真正的抽象理解,”刘易斯解释道。在数字矩阵中,当缺失数字的位置发生变化时,GPT模型的表现明显下降。人类对此没有困难。在故事类比中,GPT-4更倾向于选择第一个给出的答案作为正确答案,而人类不会受答案顺序的影响。此外,当故事的关键元素被重写时,GPT-4比人类更难处理,这表明它依赖于表面相似性而不是深层因果推理。在较简单的类比任务上,GPT模型在测试修改版本时表现下降,而人类则保持一致。然而,在更复杂的类比推理任务上,人类和AI的表现都不理想。

弱于人类认知

这项研究挑战了普遍认为像GPT-4这样的AI模型可以像人类一样推理的假设。“尽管GPT模型展示了令人印象深刻的能力,但这并不意味着它们真正理解自己在做什么,”刘易斯和米切尔总结道。“它们在跨变体泛化方面的能力仍然远逊于人类认知。GPT模型通常依赖于表面模式而非深刻理解。”这对于教育、法律和医疗等重要决策领域的AI使用是一个重要的警告。人工智能可以成为一个强大的工具,但它还不是替代人类思考和推理的替代品。

(以上内容均由Ai生成)

关键词: Gpt思考

你可能还想读

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日
人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

快速阅读: 据《印度教业务线》称,印度联合创始人纳南·尼莱卡尼表示,AI应用于解决实际问题,提升医疗与教育,强调简约设计和持续创新,反对全民基本收入,主张用AI放大人类潜力。 据《亚洲时报》报道,7月27日,纽约,印度信息技术服务巨头Inf […]

发布时间:2025年8月1日