AI

面壁智能发布MiniCPM-V4.5,4.1亿参数超越GPT-4.1-mini

发布时间:2025年8月26日    来源:szf
面壁智能发布MiniCPM-V4.5,4.1亿参数超越GPT-4.1-mini

快速阅读: 面壁智能与清华大学NLP实验室联合发布MiniCPM-V4.5,参数量4.1亿,性能超越GPT-4.1-mini,支持多模态任务,优化边缘设备部署,开源促进学术与商业创新。

面壁智能与清华大学NLP实验室联合发布最新端侧多模态大模型MiniCPM-V4.5,标志着边缘AI技术迈上新台阶。作为MiniCPM系列的最新力作,该模型凭借卓越的性能、高效的部署能力和广泛的应用场景,再次刷新了业界对端侧多模态模型的期待。以下是对其技术突破的详细解析。

技术突破:更小参数,更强性能

MiniCPM-V4.5基于SigLIP2-400M视觉模块和MiniCPM4-3B语言模型构建,总参数量仅为4.1亿,但在多项基准测试中表现出色。官方数据显示,MiniCPM-V4.5在OpenCompass综合评估中取得69.0的平均得分,超越了GPT-4.1-mini(20250414版本,64.5分)和Qwen2.5-VL-3B-Instruct(64.5分),成为端侧多模态模型的性能标杆。与前代MiniCPM-V2.6(8.1亿参数,65.2分)相比,新模型在参数量大幅减少的同时,性能显著提升,充分展现了面壁智能在模型压缩与优化方面的深厚技术积累。

多模态能力升级:视觉、文本、视频全能

MiniCPM-V4.5支持单图、多图及视频理解,并在高分辨率图像处理、OCR(光学字符识别)以及多语言支持方面表现出色。模型可处理高达180万像素(1344×1344)的图像,支持任意宽高比,OCR性能在OCRBench上超越GPT-4o、Gemini1.5Pro等主流专有模型。在Mantis-Eval、BLINK和Video-MME等基准测试中,MiniCPM-V4.5展现了领先的多图推理和视频时空信息处理能力,适用于复杂场景下的内容分析。此外,模型继承了MiniCPM系列的多语言优势,支持英语、中文、德语、法语、意大利语、韩语等30多种语言,为全球用户提供无缝的多模态交互体验。

高效部署:专为边缘设备优化

MiniCPM-V4.5在效率方面表现优异。得益于高token密度(处理180万像素图像仅需640个视觉token,较多数模型减少75%),模型在推理速度、首token延迟、内存占用和功耗上均有显著优化。测试显示,MiniCPM-V4.5在iPhone16Pro Max上实现首token延迟低于2秒,解码速度超过17token/s,且无明显发热问题。这使模型能够轻松部署于智能手机、平板电脑等边缘设备,满足移动、离线和隐私保护场景的需求。此外,MiniCPM-V4.5支持多种部署方式,包括llama.cpp、Ollama、vLLM和SGLang,并提供iOS应用支持,极大降低了开发者的使用门槛。

开放生态:推动学术与商业创新

面壁智能延续其开放源代码的传统,MiniCPM-V4.5遵循Apache2.0许可证,向学术研究人员完全开源,商业用户通过简单注册即可免费使用。这一举措进一步降低了多模态AI的进入壁垒,推动了学术研究与商业应用的双向发展。截至目前,MiniCPM系列已在GitHub和HuggingFace上累计获得超百万次下载,成为边缘AI领域的标杆模型。

MiniCPM-V4.5的发布不仅展示了面壁智能在多模态大模型领域的领先地位,也为边缘AI的普及化应用指明了方向。从实时视频分析到智能文档处理,再到多语言交互,MiniCPM-V4.5的广泛适用性为教育、医疗、内容创作等行业带来了新的可能性。随着端侧计算能力的快速提升和模型效率的持续优化,MiniCPM-V4.5有望成为边缘设备上媲美云端AI的“新常态”。

项目链接:https://huggingface.co/openbmb/MiniCPM-V-4_5

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日