快速阅读: 月之暗面推出Kimi Linear,一种新型混合线性注意力架构,性能优于传统全注意力方法。核心技术KDA优化RNN记忆管理,1M token场景下KV缓存减少75%,解码吞吐量提升6倍。 近日,月之暗面推出了一种全新的混合线性注 […]