AI

MiniCPM-V 4.5发布,8亿参数助力移动端AI部署

发布时间:2025年9月1日    来源:szf
MiniCPM-V 4.5发布,8亿参数助力移动端AI部署

快速阅读: 开源AI社区发布MiniCPM-V4.5多模态模型,专为端侧设备优化,支持多语言和高分辨率图像处理,提升移动设备AI应用效率,降低部署门槛。

近日,开源AI社区发布了一款面向端侧设备的多模态大语言模型MiniCPM-V4.5。该模型拥有8亿参数规模,可在智能手机和平板电脑上高效运行,为移动端AI应用开辟了新的可能性。

MiniCPM-V4.5采用轻量化设计思路,专为端侧设备优化。开发团队公布的测试数据显示,该模型在OpenCompass综合评估中获得了77.2分的成绩,在同类开源模型中表现突出。模型支持单图理解、多图推理和视频分析等多种任务。

在移动设备部署方面,MiniCPM-V4.5在iPhone16 Pro Max上的首token延迟约为2秒,解码速度超过每秒17个token。通过3D-Resampler技术,模型将视频数据压缩率提升至96%,能够以64个token处理6帧视频内容,实现最高10FPS的实时视频理解。

光学字符识别是该模型的重点优化方向之一。基于LLaVA-UHD架构,模型支持高达180万像素的高分辨率图像处理,在OCRBench测试中准确率达到85.7%。此外,模型支持包括英语、中文、德语、法语在内的30多种语言。

MiniCPM-V4.5引入了可控混合思维机制,用户可通过参数设置在快速响应模式和深度推理模式间切换。快速模式适用于常规问答任务,深度模式则通过逐步推理处理复杂问题。模型基于RLAIF-V和VisCPM技术进行训练,减少了幻觉现象,提升了响应的准确性和可靠性。

MiniCPM-V4.5采用Apache-2.0许可证发布,支持学术研究免费使用,商业应用需要简单注册程序。模型兼容多种推理框架,包括llama.cpp、Ollama、vLLM和SGLang,并提供16种量化格式以适应不同硬件配置。开发团队还发布了适配iOS的应用程序,方便用户在苹果设备上体验。开发者可通过Hugging Face和GitHub获取模型代码和文档,支持通过Gradio搭建本地Web界面,也可在NVIDIA GPU上进行推理加速。

作为专为移动端优化的多模态模型,MiniCPM-V4.5在隐私敏感和离线使用场景中具有应用价值。其轻量化设计降低了AI能力的部署门槛,为个人用户和开发者提供了新的选择。然而,受参数规模限制,该模型在处理极其复杂任务时可能存在性能边界。用户在实际应用中应根据具体需求选择合适的模型方案。开发团队提醒,模型生成内容基于训练数据,用户需确保使用合规并承担相应责任。

MiniCPM-V4.5的发布体现了开源AI社区在端侧部署方向的技术探索。随着移动设备计算能力的持续提升,这类轻量化多模态模型可能为AI应用的普及化提供新的技术路径。该项目的开源特性也为研究人员和开发者提供了学习和改进的基础,有望推动端侧AI技术的进一步发展。

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日