GPT-5全网爆料,奥特曼与OpenAI面临挑战
快速阅读: 近期,OpenAI CEO Sam Altman频繁暗示GPT-5即将发布,引发广泛关注。GPT-5在多模态、软件工程和AI智能体方面有显著提升,预计2025年8月初推出,将提供多个版本。
如果炒作可以成为奥运项目,Sam Altman的奖牌数将创下纪录。在X上,有网友这样评论近期GPT-5的营销热潮。自OpenAI宣布达到国际数学奥林匹克金牌水平以来,对其高调营销的批评声就没有停歇。几乎每天都有新的GPT-5消息被“无意”曝光,一会儿是Altman在播客中感叹自己“相对于AI毫无用处”,一会儿是The Information深入报道其内部挑战,一会儿又有人在X上晒出与GPT-5的聊天截图……人们的胃口被吊足了,但关于产品的核心信息始终若隐若现。
过去一段时间,GPT-5一直被称为“最热门的未来产品”。从2022年底开始,媒体就陆续爆料其发布时间,从当年一直传到2024年8月。然而,尽管OpenAI不断刷新各种基准测试,但大家期待的GPT-5却迟迟未见踪影。OpenAI官方模型发布公告显示,其刷新的基准测试越多,大家的兴奋感反而越低。毕竟,马斯克靠二次元动漫角色Ani获得流量关注,而Grok 4刷新了多少榜单也提不起大家的兴趣。因此,OpenAI似乎转向了一种新策略,通过不断“暗示”和“吊胃口”来维持热度。
我们整理了近期所有关于GPT-5的爆料和报道,试图跳出这套营销叙事,看清在漫长预热背后,OpenAI接下来到底在押什么注。GPT-5在真正到来之前,还有哪些值得关注的信号。
### GPT-5的核心升级
与以往更新不同,GPT-5的最大亮点不仅在于跑分提升,更在于多模态、软件工程和AI智能体(Agent)这三个具有实用价值的领域展现了显著的性能提升。
#### 实现“完整的多模态”能力
这是最新爆料中最令人兴奋的特性之一。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要,GPT-5最显著的特点是“多模态能力的显著提升,实现了一个完整的多模态模型”。这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往,有望带来“吉卜力时刻”的用户体验,并在发布后登顶大多数评测榜单。
#### 软件工程能力的大幅提升
GPT-5不再局限于解决算法竞赛题,而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。一位测试者表示,在横向比较中,GPT-5的表现优于Anthropic的Claude Sonnet 4。微软内部员工在测试后透露,GPT-5在生成高质量代码的同时,并没有消耗更多的计算资源。
#### 真正可用的AI智能体
更强的推理能力意味着GPT-5能更好地理解和执行复杂的多步骤指令,从而以更少的人工监督来执行多步骤任务,向能够自主完成任务的“AI智能体”迈出关键一步。例如,有媒体称它可以遵循一套复杂的规则,判断自动客服代理是否应批准退款,而此前的模型则需要大量具体案例才能学会。
#### 攻克主观领域的“通用验证器”
为了解决推理模型难以评估的问题,OpenAI开发了一项名为“通用验证器”(universal verifier)的技术。这项技术由Ilya之前领导的超级对齐团队在去年完成。其本质上是另一个AI,专门负责检查和评估主模型的回答质量,即使在没有标准答案的场景下。因此,GPT-5不仅在编程和数学等可验证领域表现出色,在创意写作、策略分析等主观性更强的领域也取得了进展。这项技术也是OpenAI在国际数学奥林匹克竞赛中摘金的关键。
### GPT-5的技术架构
要实现上述强大的功能,GPT-5依赖于其最核心的一项变化:一个能自动为用户选择最优解的智能调度系统。综合多家媒体的报道,与以往单纯追求更大参数规模的路径不同,GPT-5旨在将传统的GPT语言模型与专注于推理的“o”系列模型(如o1、o3)整合在一起。研究人员推测,GPT-5可能并非单一模型,而是一个智能“路由系统”,能根据用户问题的难度,动态选择调用最合适的模型来处理。
对于简单请求,它会调用更快速、成本更低的GPT系列模型,实现即时响应;对于复杂难题,如STEM(科学、技术、工程和数学)或深度编程问题,它会自动切换到更强大的推理模型,进行更深入的“思考”,确保答案的质量。
### 发布、版本与最后的悬念
#### 时间
尽管早在2023年末就有媒体称OpenAI可能在2024年春季或夏季发布GPT-5,但到了2024年5月,OpenAI表示已经开始训练公司的“下一代前沿模型”,预计这个新系统将达到通往AGI(通用人工智能)的“下一个能力水平”。2025年,有关发布时间的传闻更加密集。六月份,奥特曼在访谈视频中表示GPT-5“可能在今年夏天的某个时候”发布。七月份,有媒体称为了应对欧盟的AI监管法律生效,OpenAI将在七月底发布GPT-5。之后,《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问,OpenAI被认为利用API对Claude的功能进行测试,违反了商业条款。目前,综合多个消息源,GPT-5的发布时间指向2025年8月初。
#### 版本
预计GPT-5将提供多个版本。主要的“推理整合版”将通过ChatGPT和API提供;“迷你版”(mini)也将登陆ChatGPT和API;而“纳米版”(nano)预计将仅通过API提供。
### 微软与OpenAI的合作协议
在披露的电话记录中,提到微软与OpenAI的新合作协议,实质是微软利用OpenAI来弥补自身模型研发的不足(如优化Copilot和Bing),为自己的独立研发争取时间。协议中有意模糊了AGI的定义,更侧重于短期的技术互补。协议中提到AGI的规定是,“当OpenAI实现通用人工智能后,微软将失去使用该初创公司先进技术的部分权利”。
### 挑战不断,GPT-5艰难的诞生背景
在这些亮眼的功能和发布信息背后,是一段充满挑战的研发历程。除了爆料中提到的OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练,这一惊人的训练规模外,要理解GPT-5为何会选择这条路,需回顾OpenAI近几年的技术演进路线。
#### 缩放为王与“Orion”的陨落
从2020年的GPT-3到2023年的GPT-4,OpenAI乃至整个行业都信奉着“缩放定律”(Scaling Law)。即更大的模型、更多的数据,就能带来更强的智能。这一策略催生了ChatGPT的辉煌,但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。然而,这条路的尽头似乎比预想的更早到来。在内部,一个代号为“Orion”的宏大项目曾被寄予厚望,它本该是GPT-5的前身,但现实却泼了一盆冷水。研究人员发现,传统的预训练方法开始遭遇瓶颈,高质量的网络数据日益枯竭,许多在小模型上验证有效的训练技巧,在模型规模扩大后便神秘失效。最终,Orion未能实现预期的性能飞跃,惨遭降级,并在2025年2月以GPT-4.5的名义悄然发布,很快便无人问津。这标志着OpenAI第一次在“缩放定律”这条路上撞上了南墙。
#### 推理的成功与Q*的惊喜
幸运的是,另一条道路早已在悄然探索中。早在ChatGPT诞生之前,公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。他们的工作,最终与强化学习(RL)和测试时计算(test-time computation,允许模型在推理过程中多思考一会儿)等技术结合,引发了2023年底的一场内部地震。这就是后来广为人知的Q*(或称Strawberry)技术突破。它让模型首次能够解决从未见过的数学问题,其表现出的推理能力让研究员们震惊不已,甚至“看到了模型在思考、在犯错、在回溯、在沮丧,就像在阅读一个人的思考过程”。
#### “天才”的诞生与烦恼
Q*的突破直接催生了专注于推理的o系列模型(o1、o3)。这些“母体模型”在内部测试中展现出惊人的能力,它们被给予了更多的英伟达芯片算力,甚至被赋予了联网搜索和调用代码库的能力,从而在科学等领域取得了非凡的进步。但“天才”也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时,其性能出现了严重退化。一位内部人士将其形容为,为了迁就人类的语言,而将一个“用自己独特逻辑思考的天才”强行“降智”。
### 近期奥特曼的“凡尔赛”时刻
在焦急的等待中,OpenAI的高层也不断地释放一些信号以预热GPT-5。CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。他向GPT-
(以上内容均由Ai生成)