AI

蚂蚁发布万亿参数思考模型Ring-1T,开源刷新SOTA

发布时间:2025年10月14日    来源:szf
蚂蚁发布万亿参数思考模型Ring-1T,开源刷新SOTA

快速阅读: 蚂蚁集团推出万亿参数思考模型Ring-1T,开源模型权重及训练配方,强化自然语言推理与通用能力,解决IMO难题,表现优异,采用“棒冰”算法优化训练稳定性。

10月14日凌晨,蚂蚁集团正式推出了万亿参数思考模型Ring-1T,并全面开源了模型权重及训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步增强了万亿基座的自然语言推理能力,并通过RLHF训练提升了模型的通用能力,在各项任务榜单上表现出色,更加均衡。

为了进一步激发Ring-1T在数学等复杂推理方面的能力,百灵团队此次挑战了难度更高的IMO2025(国际数学奥林匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅一次就解决了第1、3、4、5题,达到了IMO银牌水平,成为首个能够获得IMO国际数学奥林匹克奖项的开源系统。在第三次尝试IMO时,Ring-1T对第2题的几何证明给出了接近满分的证明过程,在其他顶级大模型几乎全军覆没的第6题中,Ring-1T的答案收敛到了与Gemini2.5Pro相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T在“人类偏好对齐”测试Arena-Hard V2中,以81.59%的成功率位居开源模型榜首,接近GPT-5-Thinking(High)的82.91%的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T同样取得了最高分,成为开源领域的最佳。

万亿参数思考模型训练的最大难题在于训推精度差异,即由于实现细节的不同导致训练阶段与推理阶段的精度不一致,从而引发训练崩溃。在Ring-1T模型中,蚂蚁集团采用了自主研发的“棒冰(icepop)”算法,通过带掩码的双向截断技术将训练-推理分布差异冻结在低水平,确保长序列、长周期训练的稳定性。此外,针对万亿参数模型的强化学习训练,蚂蚁集团还自主研发了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),专门针对万亿参数模型的显存管理和训推权重交换问题进行了优化,实现了单机显存碎片的秒级回收和权重的零冗余交换,使得大规模RL训练能够稳定运行。

本次发布的Ring-1T模型继续采用Ling2.0架构的1T基础模型进行后训练,Ling2.0采用了高度稀疏的MoE架构、1/32的专家激活比、FP8混合精度、MTP等多项技术,实现了高效的训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提高了模型的复杂推理能力和指令跟随、创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,未来将在后续版本中继续优化模型性能。目前,用户可以通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

据了解,截至目前,蚂蚁百灵大模型已发布了18款模型,形成了从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型——万亿参数通用大语言模型Ling-1T和万亿参数思考模型Ring-1T。随着这两款万亿参数模型的发布,百灵大模型正式进入了2.0阶段。

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日