AI

GPT-5全网爆料,奥特曼与OpenAI面临挑战

发布时间:2025年8月6日    来源:szf
GPT-5全网爆料,奥特曼与OpenAI面临挑战

快速阅读: 近期,OpenAI CEO Sam Altman频繁暗示GPT-5即将发布,引发广泛关注。GPT-5在多模态、软件工程和AI智能体方面有显著提升,预计2025年8月初推出,将提供多个版本。

如果炒作可以成为奥运项目,Sam Altman的奖牌数将创下纪录。在X上,有网友这样评论近期GPT-5的营销热潮。自OpenAI宣布达到国际数学奥林匹克金牌水平以来,对其高调营销的批评声就没有停歇。几乎每天都有新的GPT-5消息被“无意”曝光,一会儿是Altman在播客中感叹自己“相对于AI毫无用处”,一会儿是The Information深入报道其内部挑战,一会儿又有人在X上晒出与GPT-5的聊天截图……人们的胃口被吊足了,但关于产品的核心信息始终若隐若现。

过去一段时间,GPT-5一直被称为“最热门的未来产品”。从2022年底开始,媒体就陆续爆料其发布时间,从当年一直传到2024年8月。然而,尽管OpenAI不断刷新各种基准测试,但大家期待的GPT-5却迟迟未见踪影。OpenAI官方模型发布公告显示,其刷新的基准测试越多,大家的兴奋感反而越低。毕竟,马斯克靠二次元动漫角色Ani获得流量关注,而Grok 4刷新了多少榜单也提不起大家的兴趣。因此,OpenAI似乎转向了一种新策略,通过不断“暗示”和“吊胃口”来维持热度。

我们整理了近期所有关于GPT-5的爆料和报道,试图跳出这套营销叙事,看清在漫长预热背后,OpenAI接下来到底在押什么注。GPT-5在真正到来之前,还有哪些值得关注的信号。

### GPT-5的核心升级

与以往更新不同,GPT-5的最大亮点不仅在于跑分提升,更在于多模态、软件工程和AI智能体(Agent)这三个具有实用价值的领域展现了显著的性能提升。

#### 实现“完整的多模态”能力

这是最新爆料中最令人兴奋的特性之一。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要,GPT-5最显著的特点是“多模态能力的显著提升,实现了一个完整的多模态模型”。这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往,有望带来“吉卜力时刻”的用户体验,并在发布后登顶大多数评测榜单。

#### 软件工程能力的大幅提升

GPT-5不再局限于解决算法竞赛题,而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。一位测试者表示,在横向比较中,GPT-5的表现优于Anthropic的Claude Sonnet 4。微软内部员工在测试后透露,GPT-5在生成高质量代码的同时,并没有消耗更多的计算资源。

#### 真正可用的AI智能体

更强的推理能力意味着GPT-5能更好地理解和执行复杂的多步骤指令,从而以更少的人工监督来执行多步骤任务,向能够自主完成任务的“AI智能体”迈出关键一步。例如,有媒体称它可以遵循一套复杂的规则,判断自动客服代理是否应批准退款,而此前的模型则需要大量具体案例才能学会。

#### 攻克主观领域的“通用验证器”

为了解决推理模型难以评估的问题,OpenAI开发了一项名为“通用验证器”(universal verifier)的技术。这项技术由Ilya之前领导的超级对齐团队在去年完成。其本质上是另一个AI,专门负责检查和评估主模型的回答质量,即使在没有标准答案的场景下。因此,GPT-5不仅在编程和数学等可验证领域表现出色,在创意写作、策略分析等主观性更强的领域也取得了进展。这项技术也是OpenAI在国际数学奥林匹克竞赛中摘金的关键。

### GPT-5的技术架构

要实现上述强大的功能,GPT-5依赖于其最核心的一项变化:一个能自动为用户选择最优解的智能调度系统。综合多家媒体的报道,与以往单纯追求更大参数规模的路径不同,GPT-5旨在将传统的GPT语言模型与专注于推理的“o”系列模型(如o1、o3)整合在一起。研究人员推测,GPT-5可能并非单一模型,而是一个智能“路由系统”,能根据用户问题的难度,动态选择调用最合适的模型来处理。

对于简单请求,它会调用更快速、成本更低的GPT系列模型,实现即时响应;对于复杂难题,如STEM(科学、技术、工程和数学)或深度编程问题,它会自动切换到更强大的推理模型,进行更深入的“思考”,确保答案的质量。

### 发布、版本与最后的悬念

#### 时间

尽管早在2023年末就有媒体称OpenAI可能在2024年春季或夏季发布GPT-5,但到了2024年5月,OpenAI表示已经开始训练公司的“下一代前沿模型”,预计这个新系统将达到通往AGI(通用人工智能)的“下一个能力水平”。2025年,有关发布时间的传闻更加密集。六月份,奥特曼在访谈视频中表示GPT-5“可能在今年夏天的某个时候”发布。七月份,有媒体称为了应对欧盟的AI监管法律生效,OpenAI将在七月底发布GPT-5。之后,《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问,OpenAI被认为利用API对Claude的功能进行测试,违反了商业条款。目前,综合多个消息源,GPT-5的发布时间指向2025年8月初。

#### 版本

预计GPT-5将提供多个版本。主要的“推理整合版”将通过ChatGPT和API提供;“迷你版”(mini)也将登陆ChatGPT和API;而“纳米版”(nano)预计将仅通过API提供。

### 微软与OpenAI的合作协议

在披露的电话记录中,提到微软与OpenAI的新合作协议,实质是微软利用OpenAI来弥补自身模型研发的不足(如优化Copilot和Bing),为自己的独立研发争取时间。协议中有意模糊了AGI的定义,更侧重于短期的技术互补。协议中提到AGI的规定是,“当OpenAI实现通用人工智能后,微软将失去使用该初创公司先进技术的部分权利”。

### 挑战不断,GPT-5艰难的诞生背景

在这些亮眼的功能和发布信息背后,是一段充满挑战的研发历程。除了爆料中提到的OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练,这一惊人的训练规模外,要理解GPT-5为何会选择这条路,需回顾OpenAI近几年的技术演进路线。

#### 缩放为王与“Orion”的陨落

从2020年的GPT-3到2023年的GPT-4,OpenAI乃至整个行业都信奉着“缩放定律”(Scaling Law)。即更大的模型、更多的数据,就能带来更强的智能。这一策略催生了ChatGPT的辉煌,但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。然而,这条路的尽头似乎比预想的更早到来。在内部,一个代号为“Orion”的宏大项目曾被寄予厚望,它本该是GPT-5的前身,但现实却泼了一盆冷水。研究人员发现,传统的预训练方法开始遭遇瓶颈,高质量的网络数据日益枯竭,许多在小模型上验证有效的训练技巧,在模型规模扩大后便神秘失效。最终,Orion未能实现预期的性能飞跃,惨遭降级,并在2025年2月以GPT-4.5的名义悄然发布,很快便无人问津。这标志着OpenAI第一次在“缩放定律”这条路上撞上了南墙。

#### 推理的成功与Q*的惊喜

幸运的是,另一条道路早已在悄然探索中。早在ChatGPT诞生之前,公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。他们的工作,最终与强化学习(RL)和测试时计算(test-time computation,允许模型在推理过程中多思考一会儿)等技术结合,引发了2023年底的一场内部地震。这就是后来广为人知的Q*(或称Strawberry)技术突破。它让模型首次能够解决从未见过的数学问题,其表现出的推理能力让研究员们震惊不已,甚至“看到了模型在思考、在犯错、在回溯、在沮丧,就像在阅读一个人的思考过程”。

#### “天才”的诞生与烦恼

Q*的突破直接催生了专注于推理的o系列模型(o1、o3)。这些“母体模型”在内部测试中展现出惊人的能力,它们被给予了更多的英伟达芯片算力,甚至被赋予了联网搜索和调用代码库的能力,从而在科学等领域取得了非凡的进步。但“天才”也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时,其性能出现了严重退化。一位内部人士将其形容为,为了迁就人类的语言,而将一个“用自己独特逻辑思考的天才”强行“降智”。

### 近期奥特曼的“凡尔赛”时刻

在焦急的等待中,OpenAI的高层也不断地释放一些信号以预热GPT-5。CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。他向GPT-

(以上内容均由Ai生成)

关键词: GPT-5Openai奥特曼

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日