AI

蚂蚁发布万亿参数思考模型Ring-1T,开源刷新SOTA

发布时间:2025年10月14日    来源:szf
蚂蚁发布万亿参数思考模型Ring-1T,开源刷新SOTA

快速阅读: 蚂蚁集团推出万亿参数思考模型Ring-1T,开源模型权重及训练配方,强化自然语言推理与通用能力,解决IMO难题,表现优异,采用“棒冰”算法优化训练稳定性。

10月14日凌晨,蚂蚁集团正式推出了万亿参数思考模型Ring-1T,并全面开源了模型权重及训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步增强了万亿基座的自然语言推理能力,并通过RLHF训练提升了模型的通用能力,在各项任务榜单上表现出色,更加均衡。

为了进一步激发Ring-1T在数学等复杂推理方面的能力,百灵团队此次挑战了难度更高的IMO2025(国际数学奥林匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅一次就解决了第1、3、4、5题,达到了IMO银牌水平,成为首个能够获得IMO国际数学奥林匹克奖项的开源系统。在第三次尝试IMO时,Ring-1T对第2题的几何证明给出了接近满分的证明过程,在其他顶级大模型几乎全军覆没的第6题中,Ring-1T的答案收敛到了与Gemini2.5Pro相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T在“人类偏好对齐”测试Arena-Hard V2中,以81.59%的成功率位居开源模型榜首,接近GPT-5-Thinking(High)的82.91%的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T同样取得了最高分,成为开源领域的最佳。

万亿参数思考模型训练的最大难题在于训推精度差异,即由于实现细节的不同导致训练阶段与推理阶段的精度不一致,从而引发训练崩溃。在Ring-1T模型中,蚂蚁集团采用了自主研发的“棒冰(icepop)”算法,通过带掩码的双向截断技术将训练-推理分布差异冻结在低水平,确保长序列、长周期训练的稳定性。此外,针对万亿参数模型的强化学习训练,蚂蚁集团还自主研发了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),专门针对万亿参数模型的显存管理和训推权重交换问题进行了优化,实现了单机显存碎片的秒级回收和权重的零冗余交换,使得大规模RL训练能够稳定运行。

本次发布的Ring-1T模型继续采用Ling2.0架构的1T基础模型进行后训练,Ling2.0采用了高度稀疏的MoE架构、1/32的专家激活比、FP8混合精度、MTP等多项技术,实现了高效的训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提高了模型的复杂推理能力和指令跟随、创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,未来将在后续版本中继续优化模型性能。目前,用户可以通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

据了解,截至目前,蚂蚁百灵大模型已发布了18款模型,形成了从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型——万亿参数通用大语言模型Ling-1T和万亿参数思考模型Ring-1T。随着这两款万亿参数模型的发布,百灵大模型正式进入了2.0阶段。

(以上内容均由Ai生成)

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日