标签: dInfer
-
蚂蚁 dInfer 框架提速10倍,突破扩散模型推理瓶颈
快速阅读: 蚂蚁集团开源dInfer框架,大幅提升扩散模型推理速度至10倍,超过传统自回归模型。通过并行解码和KV缓存管理等技术创新,dInfer在多个数据集上表现出色,平均TPS达407.36。 近日,蚂蚁集团开源了全新的 dInfer […]
发布时间:2025-10-15 19:04 来源:szf -
蚂蚁集团发布dInfer,加速扩散语言模型推理10倍
快速阅读: 蚂蚁集团开源dInfer框架,实现扩散语言模型推理速度大幅提升,比英伟达Fast-dLLM快10.7倍,有望推动AI技术广泛应用。 近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架——dInfer。这一框架的推出,不仅 […]
发布时间:2025-10-13 20:46 来源:szf