快速阅读: vLLM团队推出vLLM-Omni,支持文本、图像、音频和视频的全模态推理,采用解耦流水线架构,提高效率,支持资源优化,适用于多样化推理需求。 在近日举行的技术发布会上,vLLM 团队正式推出了 vLLM-Omni,这是一个面向 […]