月之暗面发布Kimi Linear:KV缓存减75%,推理提速6倍

发布时间:2025年10月31日    来源:szf
月之暗面发布Kimi Linear:KV缓存减75%,推理提速6倍

快速阅读: 月之暗面发布“Kimi Linear”技术,优化Gated DeltaNet,提升RNN记忆效率。新架构在处理速度和内存占用上显著优于传统方法,适用于高速、高内存需求的AI任务,有望成行业标准。

近日,月之暗面发布了一项革命性的技术——“Kimi Linear”混合线性注意力架构。该架构在短距离、长距离处理及强化学习(RL)等多个领域,表现优于传统的全注意力方法。其核心创新点在于“Kimi Delta Attention”(KDA),这是对Gated DeltaNet的优化升级,引入了更高效的门控机制,以提高有限状态RNN(递归神经网络)的记忆使用效率。

Kimi Linear的架构设计独特,由三个Kimi Delta Attention模块和一个全局MLA(多层感知机)组成。通过改进Gated DeltaNet,KDA能够利用细粒度的门控机制,显著压缩有限状态RNN的记忆使用。这一设计不仅加快了模型处理信息的速度,还有效降低了内存占用,提升了其实用性。

官方数据显示,在处理100万token的场景下,Kimi Linear的KV缓存占用量减少了75%,解码吞吐量最高提升了6倍。在训练速度(TPOT)方面,相比传统MLA,Kimi Linear实现了6.3倍的加速。这些显著的性能提升,表明Kimi Linear在各类AI任务中具有广泛的适用性,特别是在对速度和内存有极高要求的应用场景中。

随着人工智能的快速发展,提高模型的处理能力和效率已成为行业内的关键挑战。月之暗面的Kimi Linear架构通过其创新设计,为这一领域提供了新的解决方案,未来可能成为新的行业标准。

对于Kimi Linear技术报告的详细信息,感兴趣的读者可访问官方GitHub页面了解其技术细节。技术报告链接:https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf

(以上内容均由Ai生成)

你可能还想读

英伟达供韩26万GPU,助力韩国AI产业提速

英伟达供韩26万GPU,助力韩国AI产业提速

快速阅读: 英伟达承诺向韩国提供26万个最新GPU,缓解当地AI产业短缺,助力政府及私营部门推进AI发展,提升国际竞争力。 英伟达承诺提供26万个最新一代图形处理单元,预计这将缓解韩国人工智能产业面临的严重短缺问题。这批供应有望为政府主导的 […]

发布时间:2025年11月1日
英伟达向韩国供应26万AI芯片,助力主权AI计划

英伟达向韩国供应26万AI芯片,助力主权AI计划

快速阅读: 英伟达将向韩国政府及主要企业提供26万个高性能GPU,缓解AI领域GPU短缺,增强韩国AI竞争力,支持人才培养和技术创新。 英伟达将向韩国政府及主要企业提供26万个高性能图形处理器(GPU),用于人工智能领域。这批货物预计能够缓 […]

发布时间:2025年11月1日
ChatGPT等人机对话模型为何难以模仿人类交流

ChatGPT等人机对话模型为何难以模仿人类交流

快速阅读: 挪威科技大学研究发现,大型语言模型在模仿人类对话时存在局限,如过度模仿、填充词使用不当及对话结构处理不佳,导致多数人能区分真伪。 挪威科技大学(NTNU)的研究揭示了大型语言模型在模仿人类对话时的局限性。尽管这些模型在许多方面非 […]

发布时间:2025年11月1日
AMD推AI工厂方案,加速数字转型

AMD推AI工厂方案,加速数字转型

快速阅读: AMD推出“AI工厂”概念,构建全栈计算平台支持AI基础设施建设,强调硬件与开源软件ROCm结合,推动数据中心架构革新及AI创新。 人工智能持续加速各行业的数字化转型,重塑组织构建和扩展现代基础设施的方式。高级微设备公司(Adv […]

发布时间:2025年11月1日
企业AP自动化平台获风投,加速AI创新与市场扩展

企业AP自动化平台获风投,加速AI创新与市场扩展

快速阅读: TranscendAP获Rittenhouse Ventures和Tech Council Ventures领投,未披露金额。平台自2018年推出,通过智能数据捕捉等工作流自动化功能,帮助多行业企业减少应付账款手动处理,降低成本 […]

发布时间:2025年11月1日
音乐巨头UMG携手AI平台,股价波动中蕴藏长期潜力

音乐巨头UMG携手AI平台,股价波动中蕴藏长期潜力

快速阅读: 环球音乐集团与Udio解决版权纠纷,计划2026年推AI音乐平台,股价近期下跌6.8%,但年回报率仍增1.2%,被看好为长期投资。 环球音乐集团(ENXTAM:UMG)与人工智能音乐初创公司Udio解决了版权纠纷,并计划于202 […]

发布时间:2025年11月1日
科技巨头豪掷3800亿美元加码AI投资

科技巨头豪掷3800亿美元加码AI投资

快速阅读: 微软、Meta、Alphabet和亚马逊等科技巨头财报显示,将共同投资3800亿美元于AI基础设施,以应对无限需求的AI市场,尽管面临AI泡沫风险,仍对AI未来充满信心。 随着美国财报季的推进,科技互联网巨头向华尔街表明,人工智 […]

发布时间:2025年11月1日
法官警告:AI生成法律文件错误频现

法官警告:AI生成法律文件错误频现

快速阅读: 世界各地法官正应对AI生成法律文件中的错误问题,如引用不存在案例。法国数据科学家兼律师Damien Charlotin记录了过去六个月至少490起此类“幻觉”案件,警示AI使用风险。专家建议审慎依赖AI,避免隐私泄露和信息不准确 […]

发布时间:2025年11月1日