AI

面壁智能发布MiniCPM-V4.5,手机轻松运行4.1亿参数模型

发布时间:2025年8月26日    来源:szf
面壁智能发布MiniCPM-V4.5,手机轻松运行4.1亿参数模型

快速阅读: 面壁智能与清华大学NLP实验室联合发布MiniCPM-V4.5,参数量4.1亿,性能超越GPT-4.1-mini,支持多图、视频理解和30多种语言,适用于边缘设备,开源免费使用,推动多模态AI普及。

面壁智能与清华大学NLP实验室联合发布最新端侧多模态大模型MiniCPM-V4.5,标志着边缘AI技术迈上新台阶。作为MiniCPM系列的最新成果,该模型凭借卓越的性能、高效的部署能力和广泛的应用场景,再次刷新了业界对端侧多模态模型的期望。

### 技术突破:更小参数,更强性能

MiniCPM-V4.5基于SigLIP2-400M视觉模块和MiniCPM4-3B语言模型构建,总参数量仅为4.1亿,但在多项基准测试中表现出色。官方数据显示,MiniCPM-V4.5在OpenCompass综合评估中取得69.0的平均得分,超越了GPT-4.1-mini(20250414版本,64.5分)和Qwen2.5-VL-3B-Instruct(64.5分),成为端侧多模态模型的性能标杆。相比前代MiniCPM-V2.6(8.1亿参数,65.2分),新模型在参数量大幅减少的同时,性能显著提升,充分体现了面壁智能在模型压缩与优化方面的深厚技术积累。

### 多模态能力升级:视觉、文本、视频全能

MiniCPM-V4.5支持单图、多图及视频理解,并在高分辨率图像处理、OCR(光学字符识别)以及多语言支持方面表现出色。视觉能力方面,模型可处理高达180万像素(1344×1344)的图像,支持任意宽高比,OCR性能在OCRBench上超越GPT-4o、Gemini1.5Pro等主流专有模型。多图与视频理解方面,在Mantis-Eval、BLINK和Video-MME等基准测试中,MiniCPM-V4.5展现出领先的多图推理和视频时空信息处理能力,适用于复杂场景下的内容分析。多语言支持方面,模型支持英语、中文、德语、法语、意大利语、韩语等30多种语言,为全球用户提供无缝的多模态交互体验。

### 高效部署:专为边缘设备优化

MiniCPM-V4.5在效率方面堪称典范。得益于其高token密度(处理180万像素图像仅需640个视觉token,较多数模型减少75%),模型在推理速度、首token延迟、内存占用和功耗上均有显著优化。测试显示,MiniCPM-V4.5在iPhone16Pro Max上实现首token延迟低于2秒,解码速度超过17token/s,无明显发热问题。这使得模型能够轻松部署于智能手机、平板电脑等边缘设备,满足移动、离线和隐私保护场景的需求。此外,MiniCPM-V4.5支持多种部署方式,包括llama.cpp、Ollama、vLLM和SGLang,并提供iOS应用支持,极大降低了开发者的使用门槛。

### 开放生态:推动学术与商业创新

面壁智能延续其开放源代码的传统,MiniCPM-V4.5遵循Apache2.0许可证,向学术研究人员完全开源,商业用户通过简单注册即可免费使用。这一举措进一步降低了多模态AI的进入壁垒,推动了学术研究与商业应用的双向发展。截至目前,MiniCPM系列已在GitHub和HuggingFace上累计获得超百万次下载,成为边缘AI领域的标杆模型。

MiniCPM-V4.5的发布不仅展示了面壁智能在多模态大模型领域的领先地位,也为边缘AI的普及化应用指明了方向。从实时视频分析到智能文档处理,再到多语言交互,MiniCPM-V4.5的广泛适用性为教育、医疗、内容创作等行业带来了新的可能性。随着端侧计算能力的快速提升和模型效率的持续优化,MiniCPM-V4.5有望成为边缘设备上媲美云端AI的“新常态”。

项目链接:https://huggingface.co/openbmb/MiniCPM-V-4_5

(以上内容均由Ai生成)

你可能还想读

芯纬内部人士抛售超10亿美元股票引发警报

芯纬内部人士抛售超10亿美元股票引发警报

快速阅读: 纳斯达克上市公司CoreWeave因内部人士大量抛售股票受关注,10月交易超10亿美元,股价承压下跌,引发投资者对该公司信心的质疑。 纳斯达克上市的CoreWeave (CRVW)因内部人士大量抛售股票而受到广泛关注。10月,一 […]

发布时间:2025年10月24日
升腾首席分析与AI官:用数学背景解决医疗问题

升腾首席分析与AI官:用数学背景解决医疗问题

快速阅读: 安森斯首席分析与人工智能官卡提克·拉贾强调,人工智能是一类问题而非单一事物,需识别并应用正确方法解决。他领导团队利用AI优化医疗流程,提高决策效率,同时注重人才培养和道德领导。 卡提克·拉贾,这家覆盖16个州的大型医疗系统首席分 […]

发布时间:2025年10月24日
格拉斯利宣布法官使用AI致法庭命令出错,实施新政

格拉斯利宣布法官使用AI致法庭命令出错,实施新政

快速阅读: 美国参议院司法委员会主席格拉斯利宣布收到法官们关于AI导致法院命令出错的回应,法官温盖特和尼尔斯承认错误并实施新政策,确保命令准确性,同时法院行政办公室成立AI咨询工作组,发布临时指导方针。 美国参议院司法委员会主席查克·格拉斯 […]

发布时间:2025年10月24日
AI视频生成系统不断进步,ChatGPT创始人更新发展计划

AI视频生成系统不断进步,ChatGPT创始人更新发展计划

快速阅读: 本周,顶尖开发者公布人工智能视频生成系统的最新进展,包括即将推出的安卓应用。该技术融合多种特性,引发艺术与伦理讨论,但仍不断进步,输出效果惊人。 基于人工智能的视频生成系统集多种特性于一身。的确,它们引发了关于艺术、创作者角色及 […]

发布时间:2025年10月24日
美法官承认职员用AI起草错误命令

美法官承认职员用AI起草错误命令

快速阅读: 美国地方法官温盖特承认其法律助理使用AI程序起草了有误的法院命令,引发争议。温盖特表示将加强审查流程,避免类似错误。参议员格拉斯利呼吁制定更明确的AI使用政策。 密西西比州的一名联邦法官承认,其工作人员使用人工智能起草了一份有误 […]

发布时间:2025年10月24日
ChatGPT遭遇重大故障,用户报告服务中断

ChatGPT遭遇重大故障,用户报告服务中断

快速阅读: ChatGPT遭遇重大技术故障,OpenAI确认“高频率错误”,用户反馈广泛。故障始于周四上午11时(美国东部时间),Downdetector数据显示问题激增。 受连续强降雨影响,南部多地出现洪水,相关部门紧急启动防汛响应。Ch […]

发布时间:2025年10月24日
OpenAI推新浏览器Atlas,挑战Google Chrome

OpenAI推新浏览器Atlas,挑战Google Chrome

快速阅读: OpenAI推出ChatGPT Atlas浏览器,挑战谷歌Chrome,集成AI功能助用户高效完成任务,计划近期增加标签组和广告拦截器等新特性。 萨姆·阿尔特曼的OpenAI继续将其生成式AI模型整合到全球大多数人的日常工具—— […]

发布时间:2025年10月24日
ChatGPT短暂故障后恢复,医疗咨询模式引关注

ChatGPT短暂故障后恢复,医疗咨询模式引关注

快速阅读: 医学研究人员报告AI医疗失误案例,患者因咨询ChatGPT致溴化物中毒精神错乱。专家长期担忧此问题,OpenAI推出专门医疗建议模式应对。 几周前,一位医学研究人员报告了一起由AI引发的医疗失误案例,详细描述了一名患者因咨询Ch […]

发布时间:2025年10月24日