OpenAI误报GPT-5解数学难题,引发同行质疑

发布时间:2025年10月21日    来源:szf
OpenAI误报GPT-5解数学难题,引发同行质疑

快速阅读: OpenAI因GPT-5声称解决未解数学问题而遭批评,实为从网上抓取答案。此事件揭示生成式AI的局限性,尽管广泛应用,但在推理能力上仍存疑。

OpenAI在构建超级智能机器的道路上显得越来越模糊。最新的迹象来自公司首席科学家们周末的一次尴尬失误。“GPT-5刚刚解决了10个未解的埃尔德什问题!”该公司科学副总裁凯文·韦尔在X上兴奋地发帖,但随后删除了这条消息。

事实证明,这并非属实。该公司的最新模型只是从互联网上抓取了答案并当作自己的成果呈现。许多著名的、未解的数学家保罗·埃尔德什的问题都列在这个网站上,而OpenAI的研究人员误以为这些被标记为“开放”的问题尚未有人解决。

然而,该网站管理员、数学家托马斯·布卢姆在X上回应称,他只是没有更新这些问题的状态。GPT-5并未通过基本原理解决问题,而是从已发表的研究论文中复制了答案,而这些答案是布卢姆所不知的。“这是一个严重的误导,”布卢姆在推特上写道。韦尔和其他研究人员随后删除了他们的帖子。

竞争对手AI实验室借此机会嘲讽OpenAI的失误:“这太丢脸了,”谷歌DeepMind首席执行官德米斯·哈萨比斯在推特上评论道。确实如此。OpenAI长期以来一直认为,支持ChatGPT的大型语言模型通过大量数据抓取并综合成聪明的答案,为实现通用人工智能(AGI)提供了一条可行路径。AGI是指机器变得比人类更聪明的理论门槛。

这一雄心壮志推动了像OpenAI(估值5000亿美元)或英伟达公司这样的企业的天价估值,后者周一早上的市值达到4.5万亿美元,较去年同期的2.5万亿美元大幅增长。这是因为人们假设未来机器将能够推理并发现商业和社会中棘手问题的答案。但埃尔德什事件强烈提醒我们,支撑生成式AI热潮的大型语言模型大多只是假装擅长推理。它们仍然是高级的模式匹配工具。

当然,这对消费者和企业来说都是有用的。ChatGPT现在已被全球约10%的人口使用,生成式AI系统正在改变许多企业进行研究、客户服务、营销活动等的方式。对许多人来说,它几乎成为了谷歌的替代品。但是,认为聊天机器人技术将解决供应链管理、劳动力管理和产品设计等复杂问题的想法仍然遥不可及,部分原因在于它仍在犯错。

科技股估值飙升得益于像上周五那样的吹嘘,当时OpenAI的首席科学家们急于宣布一项成果,却没有核实事实。历史表明,过度承诺往往会减缓进步的步伐,过去的AI寒冬正是由过度膨胀的期望而非失败引发的。正如我之前所言,重大的推理突破可能需要采用不如生成式AI流行的方法,例如神经符号AI。

真正的推理能力不应与ChatGPT重组世界知识的能力相混淆,尤其是不应该被其自身的研究人员所混淆。但不要指望硅谷会停止告诉我们超级智能就在眼前,或者AI热潮将继续在信念而非真正的突破上运行。

更多来自彭博社观点的文章:

本文反映了作者的个人观点,并不一定代表编辑委员会或彭博有限合伙公司及其所有者的观点。

帕米·奥尔森是彭博社观点专栏作家,专注于技术报道。她曾是《华尔街日报》和《福布斯》的记者,著有《霸权:AI、ChatGPT和将改变世界的竞赛》一书。

更多类似故事请访问:

bloomberg.com/opinion

©2025 彭博有限合伙公司。

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日