Moonshot AI发布Kimi Linear,线性注意力提速6倍

发布时间:2025年10月31日    来源:szf
Moonshot AI发布Kimi Linear,线性注意力提速6倍

快速阅读: Moonshot AI 发布 Kimi Linear 技术报告,推出高效线性架构,显著提升速度、内存效率和长上下文处理能力,减少缓存使用量75%,解码吞吐量提升6倍,优化长文本推理和多轮对话性能。

国产大模型团队 Moonshot AI 今日在 Hugging Face 发布技术报告《Kimi Linear Tech Report》,宣布推出全新架构 Kimi Linear。这是一种能够直接替代完全注意力机制(Full Attention)的混合线性架构,具备高效性和卓越性能,被誉为“智能体时代注意力机制的新起点”。

报告指出,Kimi Linear 在速度、内存效率和长上下文处理能力三个方面均取得了显著进展。该模型可将 KV 缓存使用量减少高达 75%,并在 100 万(1M)上下文长度下实现最高 6 倍的解码吞吐量提升,大幅优化了长文本推理和多轮对话的性能。

Kimi Linear 的核心创新包括三项关键技术:Delta Attention 是一种硬件高效的线性注意力机制,通过门控 Delta 规则优化结构,实现了性能与能耗的平衡;Linear Architecture 是首个在多项指标上全面超越传统完全注意力机制的混合线性架构,兼顾了速度和模型表达能力;开放生态与实证验证方面,Moonshot 提供了开源 KDA 内核、vLLM 集成支持及模型检查点,并进行了大规模且公正的对比实验,验证了 Kimi Linear 的稳定性和可扩展性。

Moonshot AI 表示,Kimi Linear 不仅是一项架构创新,也是为智能体(AI Agent)时代设计的基础机制。随着线性注意力技术的成熟,它有望在长上下文推理、智能助手、多模态生成等应用场景中成为下一代标准。

地址:https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

(以上内容均由Ai生成)

你可能还想读

法律AI:从研究加速到智能洞察,律师如何信任并利用技术

法律AI:从研究加速到智能洞察,律师如何信任并利用技术

快速阅读: AI在法律领域的应用广泛,不仅能加速研究、深化洞察,还能优化文件管理和提高决策质量,关键在于律师对其的信任与有效利用。 人工智能(AI)无处不在——在头条新闻、供应商推介、会议讨论以及战略规划中。但对于许多律师事务所和法务部门而 […]

发布时间:2025年11月1日
“MIT研究:95%企业未从生成式AI投资中获利”

“MIT研究:95%企业未从生成式AI投资中获利”

快速阅读: 麻省理工学院研究显示,95%企业未能从生成式AI投资获益,因其实施难度大、可靠性低,易扰乱业务流程。 近几个月来,AI观察者频繁引用一项麻省理工学院的研究,该研究发现95%的企业未能从其生成式AI投资中获得回报。这项研究的流行似 […]

发布时间:2025年11月1日
谷歌Q3财报:AI驱动全业务增长,云服务收入激增

谷歌Q3财报:AI驱动全业务增长,云服务收入激增

快速阅读: Alphabet 2025财年第三季度收入1023亿美元,同比增长16%,超市场预期。AI驱动搜索、YouTube和谷歌云业务增长,全栈AI战略助力订单积压扩大至1550亿美元。 分析师:Futurum Research 发布日 […]

发布时间:2025年11月1日
英特尔洽谈收购AI芯片公司SambaNova,估值或低于50亿美元

英特尔洽谈收购AI芯片公司SambaNova,估值或低于50亿美元

快速阅读: 英特尔正与AI芯片公司SambaNova进行收购谈判,后者估值或低于2021年的50亿美元。英特尔CEO陈立武与SambaNova关系密切,但交易未定,SambaNova面临发展障碍。 据彭博新闻援引知情人士消息,英特尔公司(纳 […]

发布时间:2025年11月1日
MCP服务器引领未来AI应用新趋势

MCP服务器引领未来AI应用新趋势

快速阅读: 麦肯锡报告指出,78%的企业已应用AI技术,较2023年增长23%。MCP作为AI领域的重要进展,提供灵活、模块化的计算环境,支持分布式AI系统,提高生产力,加速开发流程,实现低延迟、高可靠性和弹性扩展。 在快速发展的时代背景下 […]

发布时间:2025年11月1日
谷歌携手信实Jio推出免费AI工具,惠及2亿5G用户

谷歌携手信实Jio推出免费AI工具,惠及2亿5G用户

快速阅读: 谷歌与Reliance Jio合作,将在18个月内向Jio 5G用户提供免费AI工具,包括Gemini 2.5 Pro和2TB存储空间,首先面向18至25岁用户开放,总价值35,100卢比。 谷歌及Alphabet首席执行官桑达 […]

发布时间:2025年11月1日
法律AI赋能:加速研究、深化洞察、智能组织

法律AI赋能:加速研究、深化洞察、智能组织

快速阅读: AI在法律领域广泛应用,通过加速研究、文件比较、智能数据组织等提升工作效率,关键在于法律团队对AI技术的信任与合理使用。 人工智能(AI)无处不在——出现在头条新闻、供应商推介、会议讨论和战略规划中。但对于许多律师事务所和法律部 […]

发布时间:2025年11月1日
三星Galaxy S26将搭载下一代AI和自研芯片

三星Galaxy S26将搭载下一代AI和自研芯片

快速阅读: 三星宣布Galaxy S26将采用最新AI技术、第二代定制AP及更强性能,包括2纳米Exynos 2600处理器和新摄像头传感器,部分市场则使用高通Snapdragon 8 Elite Gen 5。 三星已经为其下一代旗舰产品设 […]

发布时间:2025年11月1日