月之暗面发布Kimi Linear:KV缓存减75%,推理提速6倍

发布时间:2025年10月31日    来源:szf
月之暗面发布Kimi Linear:KV缓存减75%,推理提速6倍

快速阅读: 月之暗面发布“Kimi Linear”技术,优化Gated DeltaNet,提升RNN记忆效率。新架构在处理速度和内存占用上显著优于传统方法,适用于高速、高内存需求的AI任务,有望成行业标准。

近日,月之暗面发布了一项革命性的技术——“Kimi Linear”混合线性注意力架构。该架构在短距离、长距离处理及强化学习(RL)等多个领域,表现优于传统的全注意力方法。其核心创新点在于“Kimi Delta Attention”(KDA),这是对Gated DeltaNet的优化升级,引入了更高效的门控机制,以提高有限状态RNN(递归神经网络)的记忆使用效率。

Kimi Linear的架构设计独特,由三个Kimi Delta Attention模块和一个全局MLA(多层感知机)组成。通过改进Gated DeltaNet,KDA能够利用细粒度的门控机制,显著压缩有限状态RNN的记忆使用。这一设计不仅加快了模型处理信息的速度,还有效降低了内存占用,提升了其实用性。

官方数据显示,在处理100万token的场景下,Kimi Linear的KV缓存占用量减少了75%,解码吞吐量最高提升了6倍。在训练速度(TPOT)方面,相比传统MLA,Kimi Linear实现了6.3倍的加速。这些显著的性能提升,表明Kimi Linear在各类AI任务中具有广泛的适用性,特别是在对速度和内存有极高要求的应用场景中。

随着人工智能的快速发展,提高模型的处理能力和效率已成为行业内的关键挑战。月之暗面的Kimi Linear架构通过其创新设计,为这一领域提供了新的解决方案,未来可能成为新的行业标准。

对于Kimi Linear技术报告的详细信息,感兴趣的读者可访问官方GitHub页面了解其技术细节。技术报告链接:https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf

(以上内容均由Ai生成)

你可能还想读

警惕冒牌ChatGPT应用重返App Store榜单

警惕冒牌ChatGPT应用重返App Store榜单

快速阅读: 安全研究员发现两款模仿OpenAI品牌的AI聊天机器人应用,在Mac App Store上排名靠前,出自同一巴基斯坦开发者之手,提醒用户注意隐私风险。 两年前,OpenAI的GPT-4 API在App Store上迅速走红。很快 […]

发布时间:2025年11月1日
Reddit营收激增68%,AI助力利润飙升443%

Reddit营收激增68%,AI助力利润飙升443%

快速阅读: 2025年10月30日,Reddit宣布财务成果显著,销售额增长68%,DAU增至1.16亿,净利润激增443%至1.63亿美元。AI技术助力增长,公司加大海外营销投入。 2025年10月30日,热门在线社交和论坛平台Reddi […]

发布时间:2025年11月1日
AI生成《老友记》剧集诡异难看,网友批评创意枯竭

AI生成《老友记》剧集诡异难看,网友批评创意枯竭

快速阅读: 本周,一段由AI生成的《老友记》视频引发关注,视频中角色形象扭曲、表演怪异,但声音逼真。此视频揭示了AI视频生成技术的缺陷,尽管投资巨大,技术仍不成熟,引发广泛质疑。 本周,一段病毒视频展示了由人工智能生成的经典情景喜剧《老友记 […]

发布时间:2025年11月1日
15岁少年开发AI失物招领应用,简化找回流程

15岁少年开发AI失物招领应用,简化找回流程

快速阅读: 15岁高中生尼尔·库马尔创建FindIt应用,通过AI技术帮助找回丢失物品,减少经济损失和环境影响,入选贝尔维尤“市民创新挑战赛”,将在贝尔维尤学院试点。 来自华盛顿贝尔维尤的尼尔·库马尔是该市“市民创新挑战赛”的获奖者之一。( […]

发布时间:2025年11月1日
AI助力规划感恩节大餐,轻松应对厨房挑战

AI助力规划感恩节大餐,轻松应对厨房挑战

快速阅读: 感恩节来临,AI成厨房助手。通过评估厨艺、调整食谱、考虑预算和设备,AI工具如Copilot可帮助用户轻松应对节日大餐挑战,提供个性化建议。 万圣节已经过去,十一月悄然而至,是时候开始考虑感恩节的菜单了,如果你还没有开始的话。如 […]

发布时间:2025年11月1日
Meta重投AI,股价因投资者担忧大跌

Meta重投AI,股价因投资者担忧大跌

快速阅读: Meta因一次性160亿美元税收费用致股价下跌,市值蒸发超2200亿美元。分析师意见分歧,部分担忧成本过高,但Rosenblatt Securities等认为投资AI前景乐观,维持“强烈买入”评级。 由于Meta在季度财报中报告 […]

发布时间:2025年11月1日
科技巨头豪赌AI:4000亿投资是战略还是泡沫?

科技巨头豪赌AI:4000亿投资是战略还是泡沫?

快速阅读: 大型科技公司今年投入3800亿至4000亿美元建设AI基础设施,引发未来投资回报与泡沫风险的争论。高管视此为必要,分析师警告可能形成“工业”泡沫。 今年,大型科技公司已投入约3800亿至4000亿美元用于人工智能基础设施建设,推 […]

发布时间:2025年11月1日
困惑推出新AI专利搜索工具

困惑推出新AI专利搜索工具

快速阅读: AI搜索公司Perplexity推出专利搜索引擎Perplexity Patents,支持自然语言查询,简化专利搜索过程,用户可轻松查找特定领域专利信息。 现在,AI搜索公司Perplexity推出了一款专门针对专利的新搜索引擎 […]

发布时间:2025年11月1日