快速阅读: 蚂蚁集团发布Ring-flash-linear-2.0-128K模型,采用混合线性注意力机制和稀疏MoE架构,仅激活6.1B参数实现高性能,支持128K上下文,提升长文本处理效率,助力高效AI编程。 在当前AI大模型竞争激烈的背 […]