“OpenAI‘企鹅’模型矩阵曝光，Emperor512挑战GPT-5.2”

发布时间：2025年12月4日来源：szf

快速阅读: GitHub与DesignArena泄露OpenAI“企鹅”模型矩阵，含四档推理预算，Emperor512性能领先，Mumble0实现零推理，新增“Memory Search”功能，OpenAI或发布Shallotpeat与Garlic模型，行业面临重大变革。

12月4日凌晨，GitHub与DesignArena同步泄露了OpenAI内部代号为“企鹅”（Penguin）的全新模型矩阵，首次曝光了四档推理预算：旗舰型号Emperor512、中端Rockhopper64、轻量级Macaroni16以及零推理Mumble0，覆盖从云端到边缘的全场景需求。图片由AI生成，授权服务商为Midjourney。

内部文件显示，Emperor拥有512单位的“juice”推理预算，是现行模型的8-10倍，端到端延迟控制在80毫秒以内，实现“零等待”对话体验。代码路径已嵌入实时剪枝与动态计算分配，疑似为明年GPT-5.2提供底层架构。

四档预算对应四种不同的延迟：Macaroni主打极速，Mumble彻底去除推理，Rockhopper（64）定位“推理+速度”平衡，目标是替代GPT-4.5，Macaroni（16）面向移动端，首次在8Gen3芯片上成功运行70B模型，Mumble（0）完全跳过推理步骤，响应时间小于50毫秒，适用于高频自动完成与语音打断场景。

记忆搜索功能同步曝光：一键召回对话上下文。泄露的代码显示，ChatGPT将新增“Memory Search”按钮，用户可以通过自然语言即时检索历史记忆，无需手动翻找聊天记录。该功能已进入内测阶段，预计与企鹅家族模型一同上线。

OpenAI拉响红色警报。The Information补充报道，OpenAI下周或将发布内部代号为Shallotpeat的新推理模型，性能已超越Gemini3；另一款名为Garlic的模型已完成预训练，计划于2026年初以GPT-5.2/5.5的形式推出，主打“小参数+高密度知识”路线，直接对标谷歌的“预训练飞跃”。

行业迎来重大震荡：开源与闭源同时提速。对于开发者而言，四档预算意味着同一代号即可调用不同的“延迟-成本-精度”组合，API定价有望下降30%。对于竞争对手，OpenAI首次将“推理预算”明码标价，迫使Google和Anthropic跟进类似的分级策略。对于监管机构，零推理Mumble的极速响应可能放大错误率，安全评估或将成为发布前的最后一道关卡。

OpenAI尚未公布企鹅家族的具体发布日期，但已在DesignArena开启盲测，获胜模型将直接并入ChatGPT Plus与Enterprise通道。AIbase将持续跟踪，第一时间带来基准成绩与API定价细节。

(以上内容均由Ai生成)