小米开源跨域模型MiMo-Embodied,29项基准刷新记录
快速阅读: 小米发布MiMo-Embodied模型,实现自动驾驶与具身智能跨域融合,性能全面领先,计划应用于扫地机器人、AGV及智能驾驶系统,2026年一季度起OTA更新推送,开放API促进跨域智能发展。
2025年11月21日,小米正式发布了业界首个连接自动驾驶与具身智能的跨域基础模型MiMo-Embodied,并将其模型与权重同步上线至Hugging Face和arXiv。该模型的技术亮点如下:
1. 跨域功能集成:一套参数同时支持具身智能的三大任务(可供性推理、任务规划、空间理解)与自动驾驶的三大任务(环境感知、状态预测、驾驶规划),实现了室内交互与道路决策的统一建模。
2. 双向协同增效:模型验证了室内交互与道路决策能力之间的知识迁移协同效果,为跨场景智能融合提供了新的解决方案。
3. 全链条优化:采用“具身/自动驾驶能力学习→链式思考推理增强→强化学习精细化”多阶段训练策略,大幅提升了模型在真实环境中部署的可靠性。
性能方面,在涉及感知、决策与规划的29项核心基准测试中,MiMo-Embodied全面超越现有的开源、闭源及专有模型:在具身智能领域的17项基准测试中取得了最佳成绩,自动驾驶领域的12项基准测试中刷新了最佳记录,同时在通用视觉语言任务上表现出色的泛化能力。
应用与生态建设方面,小米计划首先将MiMo-Embodied应用于自主研发的扫地机器人、工厂自动导引车(AGV)以及高阶智能驾驶系统SU7,并于2026年第一季度起通过OTA更新推送。此外,小米还将开放模型API,为家居、移动出行、制造业的开发者提供跨域智能的基础平台。
(以上内容均由Ai生成)