8B模型性能媲美32B,成本直降90%,Mira Murati引领AI训练革命

发布时间:2025年10月30日    来源:szf
8B模型性能媲美32B,成本直降90%,Mira Murati引领AI训练革命

快速阅读: 前OpenAI CTO Mira Murati领导的团队开发“在线策略蒸馏”技术,使8B小模型性能接近32B大模型,训练成本降低90%,效率提升50-100倍,推动AI民主化。

当大模型军备竞赛让算力成本高不可攀,前OpenAI首席技术官Mira Murati领衔的Thinking Machines Lab,正用一项名为“在线策略蒸馏”(On-Policy Distillation)的突破性技术,为行业按下“重启键”。

最新 研究显示:仅80亿参数的小模型,经此方法训练后,性能可达32B大模型的70%,而训练成本骤降90%,效率提升50至100倍——这意味着,中小企业甚至个人开发者,也能以极低成本训练出媲美巨头的专用AI。

50-100倍效率跃升:150步干翻1.8万GPU小时 传统强化学习(RL)训练动辄需数万步迭代与海量算力。以数学推理任务AIME’24为例,纯RL方法耗费17,920个GPU小时,准确率仅68%;而采用在线策略蒸馏的Qwen3-8B模型,仅150步训练即达70%准确率,计算开销几乎可忽略。

其核心在于“每token密集反馈”机制:不同于RL仅在回合结束给予稀疏奖励,在线蒸馏让教师模型对学生生成的每一个token实时评分,提供连续、精准的指导信号。这不仅加速收敛,更有效防止长序列训练中的“策略漂移”,让小模型在有限资源下稳定输出高质量结果。

破解“灾难性遗忘”:学新知识不忘旧本领 AI模型在注入新知识时常“忘本”——实验显示,某模型经内部文档微调后,指令遵循能力从85%暴跌至45%。而在线策略蒸馏通过实时轨迹采样+教师逐步校正,在保留41%新知识的同时,将原有能力迅速恢复至83%,远超传统微调或离线蒸馏。

这一特性使其特别适合企业场景:模型可动态学习业务新规、产品文档,而不丢失基础对话、工具调用等核心能力,真正实现“持续进化”。

四步闭环:简洁架构,普惠落地 该方法实现极为轻量,仅需四步闭环: 部署教师模型(如32B大模型)作为监督源; 学生模型生成响应轨迹; 教师计算每个token的对数概率; 以反向KL散度为损失,优化学生参数。

无需复杂基础设施,兼容现有蒸馏框架,即可实现“廉价而准确”的性能跃迁。论文指出,该技术可无缝扩展至代码生成、多模态推理等任务,为“教师-学生”协同训练开辟新路径。

Mira Murati的“降维打击”:AI民主化的关键钥匙 作为OpenAI前CTO,Murati将大模型训练的实战经验反哺于高效小模型生态。在AI安全与对齐日益重要的今天,在线策略蒸馏不仅提升效率,更通过可控的知识迁移,增强模型行为的可预测性。

行业专家预测,该技术将极大推动开源模型与边缘AI的发展——当8B模型能胜任32B任务,手机、IoT设备乃至本地服务器,都将成为高性能AI的载体。智能,正从“云端垄断”走向“人人可及”。

这场由Murati掀起的训练革命,或许正是AI从“巨头游戏”迈向“普惠工具”的转折点。当小模型也能“聪明”如大模型,真正的智能民主化时代,才刚刚开始。

(以上内容均由Ai生成)

你可能还想读

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

快速阅读: 据印度武装部队医疗局消息,12月16日,该机构联合全印医学科学研究所等单位在新德里启动全国首个AI糖尿病视网膜病变社区筛查项目,为6500万糖尿病患者提供早期眼病筛查。项目依托“MadhuNetrAI”平台,由基层医护人员使用手 […]

发布时间:2025年12月17日
印度初创Digantara融资5000万美元推进天基导弹防御

印度初创Digantara融资5000万美元推进天基导弹防御

快速阅读: 据多方确认,印度空间监视企业Digantara完成5000万美元B轮融资,将拓展导弹跟踪业务,以应对全球天基防御需求上升。该公司依托自研传感器技术,已获得美国太空司令部合同,并计划两年内发射15颗卫星,同时扩建在印度、美国和欧洲 […]

发布时间:2025年12月17日
Adobe发布Firefly精准AI视频编辑工具

Adobe发布Firefly精准AI视频编辑工具

快速阅读: 据消息指出,Adobe推出新一代AI视频编辑工具,依托Firefly平台整合多家模型,支持自然语言提示词编辑与跨模型调整,以解决AI生成内容“幻觉”问题,并开放介于基础剪辑与Premiere Pro之间的公开测试版,推动一站式创 […]

发布时间:2025年12月17日
12月值得买入的两只AI股票

12月值得买入的两只AI股票

快速阅读: 据行业统计,受甲骨文与博通财报疲软拖累,AI概念股普遍回调,部分优质标的估值回归合理区间。澳大利亚企业Iren股价较11月高点腰斩,但该公司已获得微软97亿美元合作订单,并聚焦可再生能源数据中心;Alphabet则凭借稳健现金流 […]

发布时间:2025年12月17日
CIO预测2026年AI将重塑企业 workforce 策略

CIO预测2026年AI将重塑企业 workforce 策略

快速阅读: 公开资料显示,受监管不统一与经济压力影响,2025年企业技术高管虽聚焦AI应用以推动增长,但CIO对投入持审慎态度。智能体AI虽引发关注,成功案例仍少,预计2026年将在部分场景从概念走向实践,但大规模落地仍面临部署复杂与效果不 […]

发布时间:2025年12月17日
迪拜千禧大酒店发布AI节日短片

迪拜千禧大酒店发布AI节日短片

快速阅读: 媒体注意到,迪拜Grand Millennium酒店近日推出AI生成节日短片《以孩童之眼观节庆》,通过儿童视角唤起节日温情,强化品牌亲和力。影片在多平台传播效果显著,Instagram获1.6万次曝光,领英达3.8万次曝光,并引 […]

发布时间:2025年12月17日
AI重建古罗马场景被曝充斥史实错误

AI重建古罗马场景被曝充斥史实错误

快速阅读: 消息人士透露,一段AI生成的古罗马视频因包含现代建筑和时代错置的装饰等史实错误,引发学者批评。法国波尔多蒙田大学教授库尔迪指出,该内容虽视觉逼真,却严重背离考古证据,恐误导公众对历史的认知。 近日,一段名为《古罗马|AI生成视频 […]

发布时间:2025年12月17日
Applied Digital股价暴跌17% 因AI数据中心债务风险

Applied Digital股价暴跌17% 因AI数据中心债务风险

快速阅读: 截至今日,受AI数据中心扩张推动,Applied Digital子公司于11月发行23.5亿美元高息票据,用于支持项目及偿债,但其偿债能力高度依赖核心租户CoreWeave,存在较大风险。 受人工智能数据中心业务快速扩张影响,A […]

发布时间:2025年12月17日