“OpenAI‘企鹅’模型矩阵曝光,Emperor512挑战GPT-5.2”
快速阅读: GitHub与DesignArena泄露OpenAI“企鹅”模型矩阵,含四档推理预算,Emperor512性能领先,Mumble0实现零推理,新增“Memory Search”功能,OpenAI或发布Shallotpeat与Garlic模型,行业面临重大变革。
12月4日凌晨,GitHub与DesignArena同步泄露了OpenAI内部代号为“企鹅”(Penguin)的全新模型矩阵,首次曝光了四档推理预算:旗舰型号Emperor512、中端Rockhopper64、轻量级Macaroni16以及零推理Mumble0,覆盖从云端到边缘的全场景需求。图片由AI生成,授权服务商为Midjourney。
内部文件显示,Emperor拥有512单位的“juice”推理预算,是现行模型的8-10倍,端到端延迟控制在80毫秒以内,实现“零等待”对话体验。代码路径已嵌入实时剪枝与动态计算分配,疑似为明年GPT-5.2提供底层架构。
四档预算对应四种不同的延迟:Macaroni主打极速,Mumble彻底去除推理,Rockhopper(64)定位“推理+速度”平衡,目标是替代GPT-4.5,Macaroni(16)面向移动端,首次在8Gen3芯片上成功运行70B模型,Mumble(0)完全跳过推理步骤,响应时间小于50毫秒,适用于高频自动完成与语音打断场景。
记忆搜索功能同步曝光:一键召回对话上下文。泄露的代码显示,ChatGPT将新增“Memory Search”按钮,用户可以通过自然语言即时检索历史记忆,无需手动翻找聊天记录。该功能已进入内测阶段,预计与企鹅家族模型一同上线。
OpenAI拉响红色警报。The Information补充报道,OpenAI下周或将发布内部代号为Shallotpeat的新推理模型,性能已超越Gemini3;另一款名为Garlic的模型已完成预训练,计划于2026年初以GPT-5.2/5.5的形式推出,主打“小参数+高密度知识”路线,直接对标谷歌的“预训练飞跃”。
行业迎来重大震荡:开源与闭源同时提速。对于开发者而言,四档预算意味着同一代号即可调用不同的“延迟-成本-精度”组合,API定价有望下降30%。对于竞争对手,OpenAI首次将“推理预算”明码标价,迫使Google和Anthropic跟进类似的分级策略。对于监管机构,零推理Mumble的极速响应可能放大错误率,安全评估或将成为发布前的最后一道关卡。
OpenAI尚未公布企鹅家族的具体发布日期,但已在DesignArena开启盲测,获胜模型将直接并入ChatGPT Plus与Enterprise通道。AIbase将持续跟踪,第一时间带来基准成绩与API定价细节。
(以上内容均由Ai生成)