GPT-5全网爆料，奥特曼与OpenAI面临挑战

快速阅读: 近期，OpenAI CEO Sam Altman频繁暗示GPT-5即将发布，引发广泛关注。GPT-5在多模态、软件工程和AI智能体方面有显著提升，预计2025年8月初推出，将提供多个版本。

如果炒作可以成为奥运项目，Sam Altman的奖牌数将创下纪录。在X上，有网友这样评论近期GPT-5的营销热潮。自OpenAI宣布达到国际数学奥林匹克金牌水平以来，对其高调营销的批评声就没有停歇。几乎每天都有新的GPT-5消息被“无意”曝光，一会儿是Altman在播客中感叹自己“相对于AI毫无用处”，一会儿是The Information深入报道其内部挑战，一会儿又有人在X上晒出与GPT-5的聊天截图……人们的胃口被吊足了，但关于产品的核心信息始终若隐若现。

过去一段时间，GPT-5一直被称为“最热门的未来产品”。从2022年底开始，媒体就陆续爆料其发布时间，从当年一直传到2024年8月。然而，尽管OpenAI不断刷新各种基准测试，但大家期待的GPT-5却迟迟未见踪影。OpenAI官方模型发布公告显示，其刷新的基准测试越多，大家的兴奋感反而越低。毕竟，马斯克靠二次元动漫角色Ani获得流量关注，而Grok 4刷新了多少榜单也提不起大家的兴趣。因此，OpenAI似乎转向了一种新策略，通过不断“暗示”和“吊胃口”来维持热度。

我们整理了近期所有关于GPT-5的爆料和报道，试图跳出这套营销叙事，看清在漫长预热背后，OpenAI接下来到底在押什么注。GPT-5在真正到来之前，还有哪些值得关注的信号。

### GPT-5的核心升级

与以往更新不同，GPT-5的最大亮点不仅在于跑分提升，更在于多模态、软件工程和AI智能体（Agent）这三个具有实用价值的领域展现了显著的性能提升。

#### 实现“完整的多模态”能力

这是最新爆料中最令人兴奋的特性之一。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要，GPT-5最显著的特点是“多模态能力的显著提升，实现了一个完整的多模态模型”。这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往，有望带来“吉卜力时刻”的用户体验，并在发布后登顶大多数评测榜单。

#### 软件工程能力的大幅提升

GPT-5不再局限于解决算法竞赛题，而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。一位测试者表示，在横向比较中，GPT-5的表现优于Anthropic的Claude Sonnet 4。微软内部员工在测试后透露，GPT-5在生成高质量代码的同时，并没有消耗更多的计算资源。

#### 真正可用的AI智能体

更强的推理能力意味着GPT-5能更好地理解和执行复杂的多步骤指令，从而以更少的人工监督来执行多步骤任务，向能够自主完成任务的“AI智能体”迈出关键一步。例如，有媒体称它可以遵循一套复杂的规则，判断自动客服代理是否应批准退款，而此前的模型则需要大量具体案例才能学会。

#### 攻克主观领域的“通用验证器”

为了解决推理模型难以评估的问题，OpenAI开发了一项名为“通用验证器”（universal verifier）的技术。这项技术由Ilya之前领导的超级对齐团队在去年完成。其本质上是另一个AI，专门负责检查和评估主模型的回答质量，即使在没有标准答案的场景下。因此，GPT-5不仅在编程和数学等可验证领域表现出色，在创意写作、策略分析等主观性更强的领域也取得了进展。这项技术也是OpenAI在国际数学奥林匹克竞赛中摘金的关键。

### GPT-5的技术架构

要实现上述强大的功能，GPT-5依赖于其最核心的一项变化：一个能自动为用户选择最优解的智能调度系统。综合多家媒体的报道，与以往单纯追求更大参数规模的路径不同，GPT-5旨在将传统的GPT语言模型与专注于推理的“o”系列模型（如o1、o3）整合在一起。研究人员推测，GPT-5可能并非单一模型，而是一个智能“路由系统”，能根据用户问题的难度，动态选择调用最合适的模型来处理。

对于简单请求，它会调用更快速、成本更低的GPT系列模型，实现即时响应；对于复杂难题，如STEM（科学、技术、工程和数学）或深度编程问题，它会自动切换到更强大的推理模型，进行更深入的“思考”，确保答案的质量。

### 发布、版本与最后的悬念

#### 时间

尽管早在2023年末就有媒体称OpenAI可能在2024年春季或夏季发布GPT-5，但到了2024年5月，OpenAI表示已经开始训练公司的“下一代前沿模型”，预计这个新系统将达到通往AGI（通用人工智能）的“下一个能力水平”。2025年，有关发布时间的传闻更加密集。六月份，奥特曼在访谈视频中表示GPT-5“可能在今年夏天的某个时候”发布。七月份，有媒体称为了应对欧盟的AI监管法律生效，OpenAI将在七月底发布GPT-5。之后，《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问，OpenAI被认为利用API对Claude的功能进行测试，违反了商业条款。目前，综合多个消息源，GPT-5的发布时间指向2025年8月初。

#### 版本

预计GPT-5将提供多个版本。主要的“推理整合版”将通过ChatGPT和API提供；“迷你版”（mini）也将登陆ChatGPT和API；而“纳米版”（nano）预计将仅通过API提供。

### 微软与OpenAI的合作协议

在披露的电话记录中，提到微软与OpenAI的新合作协议，实质是微软利用OpenAI来弥补自身模型研发的不足（如优化Copilot和Bing），为自己的独立研发争取时间。协议中有意模糊了AGI的定义，更侧重于短期的技术互补。协议中提到AGI的规定是，“当OpenAI实现通用人工智能后，微软将失去使用该初创公司先进技术的部分权利”。

### 挑战不断，GPT-5艰难的诞生背景

在这些亮眼的功能和发布信息背后，是一段充满挑战的研发历程。除了爆料中提到的OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练，这一惊人的训练规模外，要理解GPT-5为何会选择这条路，需回顾OpenAI近几年的技术演进路线。

#### 缩放为王与“Orion”的陨落

从2020年的GPT-3到2023年的GPT-4，OpenAI乃至整个行业都信奉着“缩放定律”（Scaling Law）。即更大的模型、更多的数据，就能带来更强的智能。这一策略催生了ChatGPT的辉煌，但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。然而，这条路的尽头似乎比预想的更早到来。在内部，一个代号为“Orion”的宏大项目曾被寄予厚望，它本该是GPT-5的前身，但现实却泼了一盆冷水。研究人员发现，传统的预训练方法开始遭遇瓶颈，高质量的网络数据日益枯竭，许多在小模型上验证有效的训练技巧，在模型规模扩大后便神秘失效。最终，Orion未能实现预期的性能飞跃，惨遭降级，并在2025年2月以GPT-4.5的名义悄然发布，很快便无人问津。这标志着OpenAI第一次在“缩放定律”这条路上撞上了南墙。

#### 推理的成功与Q*的惊喜

幸运的是，另一条道路早已在悄然探索中。早在ChatGPT诞生之前，公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。他们的工作，最终与强化学习（RL）和测试时计算（test-time computation，允许模型在推理过程中多思考一会儿）等技术结合，引发了2023年底的一场内部地震。这就是后来广为人知的Q*（或称Strawberry）技术突破。它让模型首次能够解决从未见过的数学问题，其表现出的推理能力让研究员们震惊不已，甚至“看到了模型在思考、在犯错、在回溯、在沮丧，就像在阅读一个人的思考过程”。

#### “天才”的诞生与烦恼

Q*的突破直接催生了专注于推理的o系列模型（o1、o3）。这些“母体模型”在内部测试中展现出惊人的能力，它们被给予了更多的英伟达芯片算力，甚至被赋予了联网搜索和调用代码库的能力，从而在科学等领域取得了非凡的进步。但“天才”也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时，其性能出现了严重退化。一位内部人士将其形容为，为了迁就人类的语言，而将一个“用自己独特逻辑思考的天才”强行“降智”。

### 近期奥特曼的“凡尔赛”时刻

在焦急的等待中，OpenAI的高层也不断地释放一些信号以预热GPT-5。CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。他向GPT-

(以上内容均由Ai生成)