小钢炮4.0视觉模型MiniCPM-V 4.0,手机应用更流畅
快速阅读: 近日,MiniCPM-V4.0模型发布,拥有4.1亿参数,在OpenCompass评测中得分69.0,超越多款同类模型。该模型专为移动设备设计,运行流畅无发热,提供多种使用方式,包括开源iOS应用和详细使用指南。
近日,一款名为 MiniCPM-V4.0 的新模型引起广泛关注。该模型是 MiniCPM-V 系列的最新版本,拥有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 构建。与之前版本相比,MiniCPM-V4.0 在单图、多图及视频理解方面表现优异,效率也有显著提升。
MiniCPM-V4.0 以其强大的视觉能力著称。在多个评测基准中,该模型在 OpenCompass 综合评估中取得69.0的平均分,超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1亿参数,得分65.2)和 Qwen2.5-VL-3B-Instruct(3.8亿参数,得分64.5)。在多图理解和视频理解领域,其性能同样出色。
针对移动设备设计是 MiniCPM-V4.0 的一大亮点。该模型在 iPhone 16 Pro Max 上运行流畅,首次响应延迟不到2秒,解码速度超过每秒17个 token,且无发热问题。即使在高并发请求下,也能表现出优越的吞吐能力。
为了方便用户使用,MiniCPM-V4.0 提供了多种使用方式,包括与多种平台兼容的工具,如 llama.cpp、Ollama、vLLM 等。开发团队还开源了一款可在 iPhone 和 iPad 上运行的 iOS 应用,帮助用户轻松上手。配套的 Cookbook 提供了详细的使用指南和实用示例,进一步简化了操作过程。
项目地址:https://huggingface.co/openbmb/MiniCPM-V-4
重点:
– MiniCPM-V4.0 在 OpenCompass 评测中得分69.0,超越多款同类模型。
– 该模型专为移动设备设计,响应快且无发热问题。
– 开源 iOS 应用及详细使用指南,让用户更轻松上手。
(以上内容均由Ai生成)