8B模型性能媲美32B,成本骤降90%,AI训练革命来临

发布时间:2025年11月1日    来源:szf
8B模型性能媲美32B,成本骤降90%,AI训练革命来临

快速阅读: 前OpenAI CTO Mira Murati领导的团队开发“在线策略蒸馏”技术,使8B小模型性能接近32B大模型,训练成本降低90%,效率提升50-100倍,助力AI普及。

当大模型军备竞赛让算力成本高不可攀,前OpenAI首席技术官Mira Murati领衔的Thinking Machines Lab,正用一项名为“在线策略蒸馏”(On-Policy Distillation)的突破性技术,为行业按下“重启键”。

最新 研究显示:仅80亿参数的小模型,经此方法训练后,性能可达32B大模型的70%,而训练成本骤降90%,效率提升50至100倍——这意味着,中小企业甚至个人开发者,也能以极低成本训练出媲美巨头的专用AI。

50-100倍效率跃升:150步干翻1.8万GPU小时 传统强化学习(RL)训练动辄需数万步迭代与海量算力。以数学推理任务AIME’24为例,纯RL方法耗费17,920个GPU小时,准确率仅68%;而采用在线策略蒸馏的Qwen3-8B模型,仅150步训练即达70%准确率,计算开销几乎可忽略。

其核心在于“每token密集反馈”机制:不同于RL仅在回合结束给予稀疏奖励,在线蒸馏让教师模型对学生生成的每一个token实时评分,提供连续、精准的指导信号。这不仅加速收敛,更有效防止长序列训练中的“策略漂移”,让小模型在有限资源下稳定输出高质量结果。

破解“灾难性遗忘”:学新知识不忘旧本领 AI模型在注入新知识时常“忘本”——实验显示,某模型经内部文档微调后,指令遵循能力从85%暴跌至45%。而在线策略蒸馏通过实时轨迹采样+教师逐步校正,在保留41%新知识的同时,将原有能力迅速恢复至83%,远超传统微调或离线蒸馏。

这一特性使其特别适合企业场景:模型可动态学习业务新规、产品文档,而不丢失基础对话、工具调用等核心能力,真正实现“持续进化”。

四步闭环:简洁架构,普惠落地 该方法实现极为轻量,仅需四步闭环: 部署教师模型(如32B大模型)作为监督源; 学生模型生成响应轨迹; 教师计算每个token的对数概率; 以反向KL散度为损失,优化学生参数。

无需复杂基础设施,兼容现有蒸馏框架,即可实现“廉价而准确”的性能跃迁。论文指出,该技术可无缝扩展至代码生成、多模态推理等任务,为“教师-学生”协同训练开辟新路径。

Mira Murati的“降维打击”:AI民主化的关键钥匙 作为OpenAI前CTO,Murati将大模型训练的实战经验反哺于高效小模型生态。在AI安全与对齐日益重要的今天,在线策略蒸馏不仅提升效率,更通过可控的知识迁移,增强模型行为的可预测性。

行业专家预测,该技术将极大推动开源模型与边缘AI的发展——当8B模型能胜任32B任务,手机、IoT设备乃至本地服务器,都将成为高性能AI的载体。智能,正从“云端垄断”走向“人人可及”。

这场由Murati掀起的训练革命,或许正是AI从“巨头游戏”迈向“普惠工具”的转折点。当小模型也能“聪明”如大模型,真正的智能民主化时代,才刚刚开始。

(以上内容均由Ai生成)

你可能还想读

阿里千问澄清全员大会吃豆包图系AI生成

阿里千问澄清全员大会吃豆包图系AI生成

快速阅读: 据阿里千问消息,针对网传“全员大会吃豆包”图片,公司澄清系AI伪造,Logo与工牌均有误,并呼吁同行理性竞争。阿里千问App自11月17日公测以来,23天月活用户突破3000万,现已成立C端事业群,由副总裁吴嘉负责。 今日,一张 […]

发布时间:2025年12月19日
全国产船舶交通管理系统在大连落地

全国产船舶交通管理系统在大连落地

快速阅读: 据机构披露,12月17日,大连船舶交通管理系统完成全国产化改造并正式交付,成为国内首个全信创VTS系统。该系统融合辽鲁20座雷达信号,具备智能告警与商渔避碰功能,显著提升通航效率和监管能力。 12月17日,大连船舶交通管理系统更 […]

发布时间:2025年12月19日
LeCun创立新公司专注世界模型研究

LeCun创立新公司专注世界模型研究

快速阅读: 记者从相关部门获悉,人工智能科学家杨立昆将创办AMI Labs,聚焦“世界模型”研究以突破大模型局限,并采用JEPA架构探索通用智能。公司计划于2026年1月成立,估值达30亿欧元,由其前Meta同事勒布伦出任CEO负责运营。 […]

发布时间:2025年12月19日
QQ音乐推本地AI作曲几分钟生成完整歌曲

QQ音乐推本地AI作曲几分钟生成完整歌曲

快速阅读: 记者从相关部门获悉,QQ音乐依托酷睿Ultra处理器推出本地化“AI作歌”功能,用户无需联网即可在设备端快速生成完整原创歌曲,既降低创作门槛,又保障歌词与旋律等敏感数据的隐私安全。 AI音乐创作正加速从云端走向个人设备。近日,Q […]

发布时间:2025年12月19日
火狐浏览器将推AI功能“终止开关”

火狐浏览器将推AI功能“终止开关”

快速阅读: 据AIbase报道,Mozilla新任CEO计划将Firefox转型为“现代AI浏览器”,引发用户对隐私和功能臃肿的担忧。为此,开发者宣布推出全局“终止开关”,彻底移除所有AI功能,并采取默认关闭、用户主动选择加入的模式,以重建 […]

发布时间:2025年12月19日
Manus 8个月ARR破1亿美元创全球纪录

Manus 8个月ARR破1亿美元创全球纪录

快速阅读: 据Manus消息,该公司年度经常性收入突破1亿美元,创全球初创企业最快纪录。自3月产品上线以来,其AI代理平台月复合增长率超20%,已处理147万亿tokens,并在多国市场实现用户真实付费,验证了通用AI代理的商业化潜力。 新 […]

发布时间:2025年12月19日
微信元宝AI助手上线一句话提醒功能

微信元宝AI助手上线一句话提醒功能

快速阅读: 12月19日消息,微信元宝AI助手上线智能提醒功能,用户可通过文字或语音发送任务指令,系统将自动识别时间与事项并准时推送通知,操作简便,支持老年用户。该助手无需下载,以好友形式集成于微信,并提供图文解析等实用工具。 近日,微信元 […]

发布时间:2025年12月19日
豆包上线Seedance 1.5 Pro可生成有声视频

豆包上线Seedance 1.5 Pro可生成有声视频

快速阅读: 公开资料显示,字节跳动在豆包平台上线“Seedance1.5Pro”音视频模型,支持通过文字同步生成语义匹配的画面、音效与台词,提升音画一致性与自然度,并实现电影感运镜与复杂动作捕捉;普通用户上传图片并输入提示词,即可零门槛制作 […]

发布时间:2025年12月19日