快速阅读: 开源社区推出LLaVA-OneVision-1.5,多模态模型支持图像、视频输入,训练分三阶段,提升视觉语言理解,性能优异超越Qwen2.5-VL。 近日,开源社区推出了LLaVA-OneVision-1.5,这是一款全新的多模 […]