Thinking Machine推出在线策略蒸馏,小模型训练效率提升百倍

发布时间:2025年10月28日    来源:szf
Thinking Machine推出在线策略蒸馏,小模型训练效率提升百倍

快速阅读: AI团队Thinking Machine发布在线策略蒸馏技术,大幅提升小模型训练效率50至100倍,获前OpenAI CTO转发关注。此技术融合强化与监督学习优势,解决模型“灾难性遗忘”,降低开发成本,推动高效智能解决方案发展。

近日,AI新锐团队Thinking Machine发布了一种突破性的训练方法——在线策略蒸馏(On-Policy Distillation),使得小模型在特定任务上的训练效率提升了50至100倍。这一成果一经发布,立即得到了前OpenAI首席技术官Mira Murati的转发,引起了学术界和工业界的广泛关注。

在线策略蒸馏融合了强化学习与监督学习,开创了“AI教练”新模式。传统AI训练面临两大难题:强化学习使模型能够自主探索,虽然灵活但效率低下;监督微调则直接提供标准答案,虽高效但较为僵化。在线策略蒸馏巧妙地结合了这两者的优势,就像给学生模型配上了“实时教练”。学生模型在自主生成内容时,强大的教师模型会对其每一步输出进行动态评分和指导,通过最小化两者间的KL散度,实现精确且稳定的知识转移。

这种机制不仅克服了传统蒸馏方法“只学结果、不学过程”的问题,还有效防止了模型“走捷径”或过拟合,显著提高了模型的泛化能力。实际测试显示,在数学推理任务中,研究团队仅用了原强化学习方法1/7到1/10的训练步数,就使8B小模型达到了接近32B大模型的性能水平,整体计算成本降低了两个数量级。这意味着,即使资源有限的中小企业或研究团队,也能够高效地训练出与大公司相匹敌的专业模型。

更重要的是,这种方法成功解决了企业AI落地过程中常见的“灾难性遗忘”问题。在一个企业助理实验中,模型在学习新业务知识的同时,还能完好地保留原有的对话和工具调用能力,为需要持续迭代的行业AI系统提供了可行方案。

该研究由Kevin Lu领导,他曾是OpenAI的关键项目负责人,现在作为Thinking Machine的核心成员,将大模型训练的前沿经验应用于高效的小模型生态系统。他的团队认为,在AI日益垂直化和场景化的今天,“小而精”的模型将成为商业应用的主力军,而在线策略蒸馏正是实现这一目标的关键技术。

随着算力瓶颈的日益突出,行业正从追求大模型转向寻求高效的智能化解决方案。Thinking Machine的这一突破,不仅大大降低了AI开发的门槛,也预示着一个高性价比专业模型的新时代即将到来。论文链接:https://thinkingmachines.ai/blog/on-policy-distillation/

(以上内容均由Ai生成)

你可能还想读

英伟达首次展示Vera Rubin超级芯片,88核CPU配双GPU

英伟达首次展示Vera Rubin超级芯片,88核CPU配双GPU

快速阅读: 鲁宾GPU于2025年9月在台湾封装,散热器尺寸与布莱克威尔相似,无法确定封装尺寸。维拉CPU为多芯片设计,内部有明显接缝。 鲁宾GPU上的标记显示,该处理器于2025年第38周在台湾封装,大约是9月下旬,这表明公司已经使用这款 […]

发布时间:2025年10月29日
Opera One升级内置AI,提升浏览体验

Opera One升级内置AI,提升浏览体验

快速阅读: Opera One R3更新推出全新AI,基于Opera Neon技术,更快速智能,无需第三方扩展,集成安全隐私功能,支持多标签页综合分析及日程管理,界面移至右侧,取代Aria。 作为Opera One R3更新的一部分,我们正 […]

发布时间:2025年10月29日
OpenAI计划2028年前开发全自动AI研究员加速科学发现

OpenAI计划2028年前开发全自动AI研究员加速科学发现

快速阅读: OpenAI计划2028年前开发出全自动AI研究员,加速科学发现,推动超级智能发展;同时完成公司重组,微软持有27%股份,价值1350亿美元。 OpenAI首席执行官萨姆·阿尔特曼宣布,公司计划到2028年开发出一位完全自动化的 […]

发布时间:2025年10月29日
模拟芯片加速AI训练,能耗降低千倍

模拟芯片加速AI训练,能耗降低千倍

快速阅读: 北京大学研发模拟芯片组,提升矩阵方程求解速度和精度,能耗远低于现有数字芯片,有望缓解AI模型训练中的能源消耗问题。 模拟计算机在解决训练人工智能模型所需的关键方程方面速度快且能耗低,可能成为应对数据中心因人工智能热潮而日益增长的 […]

发布时间:2025年10月29日
Phia创始人谈AI如何改变在线购物体验

Phia创始人谈AI如何改变在线购物体验

快速阅读: Phia由Phoebe Gates和Sophia Kianni创立,专注于利用AI改善在线购物体验,提供价格比较及二手商品信息,旨在减少碳足迹并提高购物效率。 当Phia的创始人Phoebe Gates和Sophia Kiann […]

发布时间:2025年10月29日
Adobe展示AI照片编辑新技术,一键完成复杂操作

Adobe展示AI照片编辑新技术,一键完成复杂操作

快速阅读: Adobe Max展示多项摄影新技术,包括Trace Erase、Light Touch和空间照明等工具,通过Firefly AI模型实现快速照片编辑,如一键移除干扰物、调整光线和3D渲染,简化复杂编辑过程。 每年在Adobe […]

发布时间:2025年10月29日
微软支持OpenAI重组,确保长期利益与技术领先

微软支持OpenAI重组,确保长期利益与技术领先

快速阅读: OpenAI转型为公益企业,微软持股27%。非营利部门更名为OpenAI基金会,持有约1300亿美元股权,初期投入250亿美元聚焦健康突破与AI弹性技术,确保AGI惠及全人类。 OpenAI 已完成转型,成为一家公益企业,微软持 […]

发布时间:2025年10月29日
OceanPal进军AI与区块链,推出SovereignAI子公司

OceanPal进军AI与区块链,推出SovereignAI子公司

快速阅读: 希腊船东OceanPal成立新子公司SovereignAI,聚焦AI和区块链,获1.2亿美元融资,将与NEAR基金会合作开发AI主权基础设施,收购NEAR代币10%,推动AI与去中心化技术发展。 希腊船东OceanPal在传统航 […]

发布时间:2025年10月29日