AI

面壁智能发布MiniCPM-V4.5,4.1亿参数超越GPT-4.1-mini

发布时间:2025年8月26日    来源:szf
面壁智能发布MiniCPM-V4.5,4.1亿参数超越GPT-4.1-mini

快速阅读: 面壁智能与清华大学NLP实验室联合发布MiniCPM-V4.5,参数量4.1亿,性能超越GPT-4.1-mini,支持多模态任务,优化边缘设备部署,开源促进学术与商业创新。

面壁智能与清华大学NLP实验室联合发布最新端侧多模态大模型MiniCPM-V4.5,标志着边缘AI技术迈上新台阶。作为MiniCPM系列的最新力作,该模型凭借卓越的性能、高效的部署能力和广泛的应用场景,再次刷新了业界对端侧多模态模型的期待。以下是对其技术突破的详细解析。

技术突破:更小参数,更强性能

MiniCPM-V4.5基于SigLIP2-400M视觉模块和MiniCPM4-3B语言模型构建,总参数量仅为4.1亿,但在多项基准测试中表现出色。官方数据显示,MiniCPM-V4.5在OpenCompass综合评估中取得69.0的平均得分,超越了GPT-4.1-mini(20250414版本,64.5分)和Qwen2.5-VL-3B-Instruct(64.5分),成为端侧多模态模型的性能标杆。与前代MiniCPM-V2.6(8.1亿参数,65.2分)相比,新模型在参数量大幅减少的同时,性能显著提升,充分展现了面壁智能在模型压缩与优化方面的深厚技术积累。

多模态能力升级:视觉、文本、视频全能

MiniCPM-V4.5支持单图、多图及视频理解,并在高分辨率图像处理、OCR(光学字符识别)以及多语言支持方面表现出色。模型可处理高达180万像素(1344×1344)的图像,支持任意宽高比,OCR性能在OCRBench上超越GPT-4o、Gemini1.5Pro等主流专有模型。在Mantis-Eval、BLINK和Video-MME等基准测试中,MiniCPM-V4.5展现了领先的多图推理和视频时空信息处理能力,适用于复杂场景下的内容分析。此外,模型继承了MiniCPM系列的多语言优势,支持英语、中文、德语、法语、意大利语、韩语等30多种语言,为全球用户提供无缝的多模态交互体验。

高效部署:专为边缘设备优化

MiniCPM-V4.5在效率方面表现优异。得益于高token密度(处理180万像素图像仅需640个视觉token,较多数模型减少75%),模型在推理速度、首token延迟、内存占用和功耗上均有显著优化。测试显示,MiniCPM-V4.5在iPhone16Pro Max上实现首token延迟低于2秒,解码速度超过17token/s,且无明显发热问题。这使模型能够轻松部署于智能手机、平板电脑等边缘设备,满足移动、离线和隐私保护场景的需求。此外,MiniCPM-V4.5支持多种部署方式,包括llama.cpp、Ollama、vLLM和SGLang,并提供iOS应用支持,极大降低了开发者的使用门槛。

开放生态:推动学术与商业创新

面壁智能延续其开放源代码的传统,MiniCPM-V4.5遵循Apache2.0许可证,向学术研究人员完全开源,商业用户通过简单注册即可免费使用。这一举措进一步降低了多模态AI的进入壁垒,推动了学术研究与商业应用的双向发展。截至目前,MiniCPM系列已在GitHub和HuggingFace上累计获得超百万次下载,成为边缘AI领域的标杆模型。

MiniCPM-V4.5的发布不仅展示了面壁智能在多模态大模型领域的领先地位,也为边缘AI的普及化应用指明了方向。从实时视频分析到智能文档处理,再到多语言交互,MiniCPM-V4.5的广泛适用性为教育、医疗、内容创作等行业带来了新的可能性。随着端侧计算能力的快速提升和模型效率的持续优化,MiniCPM-V4.5有望成为边缘设备上媲美云端AI的“新常态”。

项目链接:https://huggingface.co/openbmb/MiniCPM-V-4_5

(以上内容均由Ai生成)

你可能还想读

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

快速阅读: Apriority宣布完成230万美元种子轮融资,由Techstars等领投。平台利用AI技术优化债务管理,帮助借款人节省利息,掌握财务控制权,尤其惠及低收入家庭。 旧金山,2025年10月23日 —— 以借款人为核心的服务平台 […]

发布时间:2025年10月23日
Cercli获1200万美元融资,加速AI劳动力平台发展

Cercli获1200万美元融资,加速AI劳动力平台发展

快速阅读: 阿联酋工作管理平台Cercli获1200万美元A轮融资,由Picus Capital领投。资金将用于产品开发、AI创新及市场扩展,目标中东、欧洲和北美。Cercli实现每月22%增长率,客户覆盖50国。 总部位于阿联酋的工作管理 […]

发布时间:2025年10月23日
扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

快速阅读: Meta宣布裁减AI部门约600名工程师,涉及FAIR等多个团队,旨在精简业务提高效率。CEO扎克伯格重申AI仍是公司核心,将继续投资高级机器学习和超级智能项目。 Meta近日宣布从其人工智能(AI)部门裁员约600名工程师,此 […]

发布时间:2025年10月23日
Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

快速阅读: 风险投资公司a16z计划筹集100亿美元,重点投资AI和国防,未提及加密货币。此举令人意外,因a16z曾是加密领域的重要支持者,近期仍积极投资相关项目。 据报道,风险投资公司安德森·霍洛维茨(a16z)正在寻求筹集约100亿美元 […]

发布时间:2025年10月23日
花旗资助香港390万港元,助力贫困青年掌握AI技能

花旗资助香港390万港元,助力贫困青年掌握AI技能

快速阅读: 花旗基金会向香港“改变年轻生命基金会”捐赠50万美元,支持为期两年的“求职挑战”项目,提升弱势青少年的人工智能技能和求职能力,增强其就业竞争力。 花旗基金会向香港“改变年轻生命基金会”拨款50万美元(约390万港元),用于为期两 […]

发布时间:2025年10月23日
AI成新界面,企业转型加速

AI成新界面,企业转型加速

快速阅读: 自动驾驶技术从微小升级到移除方向盘,彻底改变车辆设计和旅程体验,重塑汽车与环境的关系。AI发展类似,通过小步快跑实现重大转变,成为统一的用户界面,改善客户互动体验。 多年来,汽车自主驾驶功能的发展似乎只是一系列微小的升级,比如车 […]

发布时间:2025年10月23日
实博蒂克斯成立顾问委员会,推动AI技术发展

实博蒂克斯成立顾问委员会,推动AI技术发展

快速阅读: Realbotix成立顾问委员会,增强AI技术,调整董事会。成员包括谷歌萨利姆·哈桑及转任的安德鲁·德苏扎,目标推进AI与机器人技术发展。弗雷德·派退休,公司感谢其贡献。调整优化产品,强化全球市场地位。 Realbotix公司宣 […]

发布时间:2025年10月23日
OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

快速阅读: OpenAI宣布在美国扩展Stargate数据中心计划,包括威斯康星州Lighthouse项目,预计2028年完工,将开发近1吉瓦电力,采用可持续能源和环保措施,创造数千就业岗位。 该设施是OpenAI在披露美国五个Starga […]

发布时间:2025年10月23日