AI

蚂蚁发布万亿参数模型Ling-1T,性能超越GPT-5

发布时间:2025年10月13日    来源:szf
蚂蚁发布万亿参数模型Ling-1T,性能超越GPT-5

快速阅读: 蚂蚁集团开源Ling-1T,一万亿参数模型,采用FP8低精度训练。该模型在数学推理和代码生成上表现优异,正研究新架构解决超长上下文处理成本。

蚂蚁集团近日宣布开源其最新研发的旗舰大模型——Ling-1T,该模型拥有高达一万亿个参数,是目前所知使用FP8低精度模式训练的最大基座模型。Ling-1T由蚂蚁集团内部的“百灵”团队开发,标志着人工智能技术的一次重大突破。

据团队介绍,Ling-1T隶属于Ling2.0模型家族,该家族分为三大系列:Ling系列、Ring系列和Ming系列。Ling系列专注于处理通用任务,以速度和效率为核心;Ring系列则侧重于深度思考和复杂推理;Ming系列为多模态模型,能处理更加丰富多样的信息类型。

Ling-1T虽然参数量达到一万亿,但在处理每个token时,实际激活的参数约为500亿,显著降低了运算成本。为支持这一庞大模型,蚂蚁团队提出了“Ling缩放定律”,通过300多个模型的实验,总结出计算效率与专家激活比例之间的关系。此外,团队还研发了名为WSM的学习率调度器,能够在训练过程中自动调整学习策略,确保模型的稳定高效训练。

Ling-1T的训练过程分为三个阶段:预训练、中训练和后训练。预训练阶段,模型接触到的数据量超过20万亿个token,其中包括大量的推理密集型语料。中训练阶段则重点强化模型的推理能力,后训练阶段通过“演进式思维链”技术进行自我迭代,提高推理精度。

与其他主流模型相比,Ling-1T在多个测试中表现出色,特别是在数学推理和代码生成能力上,展现了卓越的性能。在社区测试中,Ling-1T在处理复杂任务时也表现出色,例如成功模拟物理现象和宇宙演化等。

尽管Ling-1T展示了强大的能力,但在处理超长上下文时仍面临较高的成本问题。蚂蚁团队表示,正在研究新的混合注意力架构来解决这一挑战。

开源地址:

HuggingFace: https://huggingface.co/inclusionAI/Ling-1T

GitHub: https://github.com/inclusionAI/Ling-V2

划重点:

– Ling-1T是目前所知最大的一万亿参数模型,采用FP8低精度模式训练。

– 该模型在数学推理和代码生成方面超越了多个主流模型,表现出色。

– 蚂蚁团队正在研究新架构以解决Ling-1T在处理超长上下文时的成本问题。

(以上内容均由Ai生成)

关键词: 性能模型蚂蚁

你可能还想读

Coinbase新协议让AI自主完成加密支付

Coinbase新协议让AI自主完成加密支付

快速阅读: Coinbase推出MCP工具,基于x402协议,使AI代理能持有钱包、发送稳定币支付,实现机器间加密货币转账,内置限额和合规检查确保安全。 Coinbase新推出的MCP工具允许人工智能代理持有钱包并发送稳定币支付。基于Coi […]

发布时间:2025年10月24日
硅实验室推出Simplicity Ecosystem,简化物联网开发流程

硅实验室推出Simplicity Ecosystem,简化物联网开发流程

快速阅读: 硅实验室推出Simplicity生态系统,旨在简化嵌入式物联网开发,包括Simplicity Studio 6和2026年推出的Simplicity AI SDK,提供模块化工具和AI辅助设计,支持多种物联网标准。 硅实验室推出 […]

发布时间:2025年10月24日
老旧印刷厂变身高效AI数据中心

老旧印刷厂变身高效AI数据中心

快速阅读: 帕特莫斯利用旧印刷厂的液体设施,支持每机柜50至140千瓦电力需求,采用多环路液体冷却系统,确保高效散热与硬件保护,接入堪萨斯城区域冷水供应,实现环保节能。 他说道:“我认为,棕地是一种极具创意的方法来应对我们当前面临的最大问题 […]

发布时间:2025年10月24日
AI安全集成:Snyk Evo引领企业智能防护新纪元

AI安全集成:Snyk Evo引领企业智能防护新纪元

快速阅读: 数字系统的快速发展要求安全架构更加智能、灵活。Snyk Evo通过自主编排、AI感知和主动保护,重新定义AI应用安全,减少暴露风险,简化开发流程。 数字系统的快速发展迫使安全架构必须更快地思考、更智能地行动并即时适应。随着各组织 […]

发布时间:2025年10月24日
黄仁勋:美光对下一代AI突破至关重要

黄仁勋:美光对下一代AI突破至关重要

快速阅读: 英伟达与美光合作,推动AI基础设施发展。美光HBM3E内存助力英伟达GPU,提升AI性能。黄仁勋称,高性能内存对AI应用至关重要,双方合作开启消费级和企业级AI新水平。 在全球领导层就人工智能可持续发展进行辩论之际,各公司纷纷投 […]

发布时间:2025年10月24日
苹果COO确认休斯顿制造AI服务器提前发货

苹果COO确认休斯顿制造AI服务器提前发货

快速阅读: 苹果首席运营官萨比赫·汗确认,因特朗普总统推动,苹果从休斯顿新工厂提前出货美国制造的人工智能服务器,此举响应总统号召,促进本国就业。 苹果首席运营官萨比赫·汗在接受福克斯新闻网数字版采访时确认,公司正从其位于休斯顿的新工厂提前出 […]

发布时间:2025年10月24日
微软Edge浏览器增强Copilot模式,挑战AI浏览器市场

微软Edge浏览器增强Copilot模式,挑战AI浏览器市场

快速阅读: 微软Edge浏览器推出Copilot模式,提供AI代理功能,包括Actions和Journeys,支持语音操作完成任务及记录浏览历史,帮助用户从中断处继续。 Edge 浏览器推出 Copilot 模式,带来更强大的代理 AI 功 […]

发布时间:2025年10月24日
阿联酋总统重组人工智能与先进技术委员会

阿联酋总统重组人工智能与先进技术委员会

快速阅读: 阿布扎比总统重组人工智能与先进技术委员会,由谢赫·塔农任主席,旨在加速AI政策实施与技术发展,推动《阿布扎比数字政府战略2025-2027》实现。 阿布扎比,10月23日(WAM/ANI):阿布扎比酋长国总统谢赫·穆罕默德·本· […]

发布时间:2025年10月24日