月之暗面发布“Kimi Linear”,优化AI处理性能

发布时间:2025年10月31日    来源:szf
月之暗面发布“Kimi Linear”,优化AI处理性能

快速阅读: 月之暗面推出Kimi Linear,一种新型混合线性注意力架构,性能优于传统全注意力方法。核心技术KDA优化RNN记忆管理,1M token场景下KV缓存减少75%,解码吞吐量提升6倍。

近日,月之暗面推出了一种全新的混合线性注意力架构——“Kimi Linear”。据称,该架构在处理短距离、长距离信息及强化学习(RL)等多种场景中,性能超越了传统的全注意力方法。其核心技术Kimi Delta Attention(KDA)是Gated DeltaNet的优化版,特别引入了一种更高效的门控机制,以更好地管理有限状态RNN的记忆使用。

Kimi Linear的设计由三个Kimi Delta Attention单元和一个全局MLA组成。这种结构通过细粒度的门控压缩有限状态RNN的记忆,提高了模型处理信息的效率。官方表示,在处理1M token的数据场景中,Kimi Linear的KV缓存占用减少了75%,解码吞吐量最高可提升6倍,TPOT相较于传统MLA加速了6.3倍。

这一新架构为各类AI应用场景提供了更强支持,无论是信息密集型的自然语言处理任务,还是动态环境中的强化学习,Kimi Linear均表现出显著优势。随着AI技术的不断进步,这种高效的注意力机制有望为未来的智能应用带来新的突破。更多技术细节可参见Kimi Linear的技术报告,链接如下:https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf。

要点总结:

– Kimi Linear是一种新型的混合线性注意力架构,优化了信息处理性能。

– 在1M token场景下,KV缓存占用减少75%,解码吞吐量提升6倍。

– 其核心技术Kimi Delta Attention通过细粒度门控优化了RNN的记忆管理。

(以上内容均由Ai生成)

你可能还想读

苹果正测试搭载M5 Max芯片的高端iMac

苹果正测试搭载M5 Max芯片的高端iMac

快速阅读: 截至报道时,苹果正研发搭载M5 Max芯片的高端iMac。内部调试文件显示,该机型已进入测试阶段,其标识符J833c与H17C平台匹配。尽管存在工程验证机型未上市的先例,但结合2026年芯片发布时间及分析师预测,该机型量产可能性 […]

发布时间:2025年12月17日
红帽收购Chatterbox Labs强化AI安全能力

红帽收购Chatterbox Labs强化AI安全能力

快速阅读: 据红帽公司消息,该公司于近日宣布收购AI安全企业Chatterbox Labs,以强化其开源企业级AI平台的安全与可信能力。此次整合将补齐Red Hat AI 3在模型稳健性、公平性及可解释性验证方面的短板,并支持客户在混合云环 […]

发布时间:2025年12月17日
Mozilla新任CEO宣布Firefox将推AI模式

Mozilla新任CEO宣布Firefox将推AI模式

快速阅读: 据The Verge报道,Mozilla新任CEO安东尼·恩佐尔-德梅奥表示,公司明年将为Firefox推出“AI模式”,整合开源与主流AI模型,但暂不自研大语言模型,强调坚守浏览器核心业务并维护开放网络生态。 12月16日,M […]

发布时间:2025年12月17日
微软AI掌舵人盛赞奥尔特曼哈萨比斯马斯克

微软AI掌舵人盛赞奥尔特曼哈萨比斯马斯克

快速阅读: 据彭博社报道,微软AI首席执行官苏莱曼表示,公司正依托Windows用户基础推进“智能体”操作系统战略,并组建MAI Superintelligence团队,以人本主义理念发展超级智能。他同时盛赞奥尔特曼为“这一代最重要企业家之 […]

发布时间:2025年12月17日
非洲疾控中心与Zipline签署协议推进无人机医疗物流

非洲疾控中心与Zipline签署协议推进无人机医疗物流

快速阅读: 据非洲疾病预防控制中心消息,该中心近日与齐普林国际公司签署备忘录,计划通过无人机物流技术提升非洲偏远地区医疗物资配送效率及疫情应急响应能力。合作将支持成员国将无人机纳入国家公共卫生体系,强化数据驱动的监测预警,并推动本地能力建设 […]

发布时间:2025年12月16日
AI搜索重塑零售发现格局

AI搜索重塑零售发现格局

快速阅读: 12月16日消息,中小企业凭借高质量内容与规范数据结构,在人工智能时代迅速适配生成式搜索引擎优化策略,超越行业巨头。此举反映出技术变革正重塑商业竞争逻辑,信任与内容权威性成为关键优势。 在人工智能时代,市场竞争格局正发生深刻变化 […]

发布时间:2025年12月16日
海外AI模型在韩国高考数学测试中领先

海外AI模型在韩国高考数学测试中领先

快速阅读: 据科技和ICT部方面消息,韩国国产AI大模型在高丽大学主导的数学能力测评中显著落后于国际主流系统,主要原因是科学训练数据不足。部长裵京勋12月16日表示,将聚焦构建领域专用数据集,并优先发展可部署的轻量级模型。 韩国自主研发的人 […]

发布时间:2025年12月16日
韦氏词典新增“slop”指代低质AI内容

韦氏词典新增“slop”指代低质AI内容

快速阅读: 据语言学者指出,“slop”一词新指AI生成的低质数字内容,因其缺乏原创性且高度同质化,引发公众对信息真实性与网络生态健康的担忧。专家呼吁提升用户媒介素养并强化平台审核机制。 “slop”一词最早在18世纪用来形容稀泥,到19世 […]

发布时间:2025年12月16日