快速阅读: 阿里巴巴开源Qwen3-Next-80B-A3B模型,总参数800亿,训练成本下降90%,推理效率提升10倍,采用混合专家架构与多token预测机制,显著增强上下文处理能力,尤其在超长文本处理中表现优异。 近日,阿里巴巴开源了最 […]