快速阅读: 蚂蚁集团开源dInfer框架,大幅提升扩散模型推理速度至10倍,超过传统自回归模型。通过并行解码和KV缓存管理等技术创新,dInfer在多个数据集上表现出色,平均TPS达407.36。 近日,蚂蚁集团开源了全新的 dInfer […]