Moonshot AI发布Kimi Linear,线性注意力提速6倍

发布时间:2025年10月31日    来源:szf
Moonshot AI发布Kimi Linear,线性注意力提速6倍

快速阅读: Moonshot AI 发布 Kimi Linear 技术报告,推出高效线性架构,显著提升速度、内存效率和长上下文处理能力,减少缓存使用量75%,解码吞吐量提升6倍,优化长文本推理和多轮对话性能。

国产大模型团队 Moonshot AI 今日在 Hugging Face 发布技术报告《Kimi Linear Tech Report》,宣布推出全新架构 Kimi Linear。这是一种能够直接替代完全注意力机制(Full Attention)的混合线性架构,具备高效性和卓越性能,被誉为“智能体时代注意力机制的新起点”。

报告指出,Kimi Linear 在速度、内存效率和长上下文处理能力三个方面均取得了显著进展。该模型可将 KV 缓存使用量减少高达 75%,并在 100 万(1M)上下文长度下实现最高 6 倍的解码吞吐量提升,大幅优化了长文本推理和多轮对话的性能。

Kimi Linear 的核心创新包括三项关键技术:Delta Attention 是一种硬件高效的线性注意力机制,通过门控 Delta 规则优化结构,实现了性能与能耗的平衡;Linear Architecture 是首个在多项指标上全面超越传统完全注意力机制的混合线性架构,兼顾了速度和模型表达能力;开放生态与实证验证方面,Moonshot 提供了开源 KDA 内核、vLLM 集成支持及模型检查点,并进行了大规模且公正的对比实验,验证了 Kimi Linear 的稳定性和可扩展性。

Moonshot AI 表示,Kimi Linear 不仅是一项架构创新,也是为智能体(AI Agent)时代设计的基础机制。随着线性注意力技术的成熟,它有望在长上下文推理、智能助手、多模态生成等应用场景中成为下一代标准。

地址:https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

(以上内容均由Ai生成)

你可能还想读

“攻击者利用Atlas浏览器漏洞劫持ChatGPT记忆”

“攻击者利用Atlas浏览器漏洞劫持ChatGPT记忆”

快速阅读: ChatGPT的记忆功能可在不同设备间保存用户数据,引发隐私和安全风险,尤其是在混合使用环境中,可能将个人风险带入企业环境,专家对此表示担忧。 ChatGPT 的记忆功能设计用于帮助人工智能聊天机器人记住用户的查询、对话、活动、 […]

发布时间:2025年10月31日
Meta利用AI标准化并削减碳排放

Meta利用AI标准化并削减碳排放

快速阅读: Meta开发AI方法提升IT硬件供应链范围3排放估计质量,结合机器学习和生成模型分类硬件并推断PCF数据,促进排放报告标准化和数据质量提升,支持2030年净零排放目标。 Meta 开发了一种基于人工智能的方法,以提高其IT硬件供 […]

发布时间:2025年10月31日
高校科技领袖聚焦AI与数据安全,谨慎应对技术投资

高校科技领袖聚焦AI与数据安全,谨慎应对技术投资

快速阅读: Educause会议聚焦高等教育技术投资谨慎态度,公布2026年十大关注点,涵盖网络安全、人工智能人文优势及数据分析,强调成本效益与数据安全。 在纳什维尔举行的年度教育技术会议Educause上,面对7000名参会者,人工智能的 […]

发布时间:2025年10月31日
全球学术图书馆积极采用人工智能技术

全球学术图书馆积极采用人工智能技术

快速阅读: 全球信息服务公司科睿唯安报告显示,67%的图书馆正探索或实施人工智能技术,比去年增长4个百分点。学术图书馆采用率更高,主要目标支持学生学习和内容发现。美国图书馆乐观度低,仅为7%。 全球各地的图书馆正在探索或增加对人工智能的使用 […]

发布时间:2025年10月31日
三星携手英伟达打造AI超级工厂,革新芯片制造

三星携手英伟达打造AI超级工厂,革新芯片制造

快速阅读: 三星宣布建立由50,000个英伟达GPU驱动的“AI超级工厂”,旨在革新芯片制造,提升设计和生产效率,强化三星在人工智能硬件领域的地位。英伟达与三星的合作扩展了其工业生态系统,推动AI技术发展和地缘政治格局变化。 在可能成为半导 […]

发布时间:2025年10月31日
Jabali.ai推出AI游戏创作平台,简化游戏开发流程

Jabali.ai推出AI游戏创作平台,简化游戏开发流程

快速阅读: Jabali.ai推出Jabali Studio平台,支持无编程基础的用户设计、构建和发布2D、3D游戏,提供Vibe Code和Design Mode两种模式,与多家AI系统集成,旨在简化游戏创作流程,推动行业创新。 人工智能 […]

发布时间:2025年10月31日
微软因OpenAI投资损失同比激增492%

微软因OpenAI投资损失同比激增492%

快速阅读: 微软因对OpenAI投资亏损,2026财年Q1净利润减少31亿美元,每股收益下降0.41美元,亏损同比增加492.7%。微软持有OpenAI 27%股份,投资总额116亿美元。最新协议支持OpenAI转型为公共利益公司,微软IP […]

发布时间:2025年10月31日
AI反欺诈需多层防御与人机协作

AI反欺诈需多层防御与人机协作

快速阅读: Persona副总裁Alex Yen指出,信任基础设施需从一次性验证转向持续监控,应对欺诈者利用AI技术带来的挑战。AI虽强但需多因素方法辅助,结合人工审查以提高准确性与用户体验。 Persona 的产品架构副总裁 Alex Y […]

发布时间:2025年10月31日