小米开源跨域模型MiMo-Embodied，29项基准刷新记录

发布时间：2025年11月24日来源：szf

快速阅读: 小米发布MiMo-Embodied模型，实现自动驾驶与具身智能跨域融合，性能全面领先，计划应用于扫地机器人、AGV及智能驾驶系统，2026年一季度起OTA更新推送，开放API促进跨域智能发展。

2025年11月21日，小米正式发布了业界首个连接自动驾驶与具身智能的跨域基础模型MiMo-Embodied，并将其模型与权重同步上线至Hugging Face和arXiv。该模型的技术亮点如下：

1. 跨域功能集成：一套参数同时支持具身智能的三大任务（可供性推理、任务规划、空间理解）与自动驾驶的三大任务（环境感知、状态预测、驾驶规划），实现了室内交互与道路决策的统一建模。

2. 双向协同增效：模型验证了室内交互与道路决策能力之间的知识迁移协同效果，为跨场景智能融合提供了新的解决方案。

3. 全链条优化：采用“具身/自动驾驶能力学习→链式思考推理增强→强化学习精细化”多阶段训练策略，大幅提升了模型在真实环境中部署的可靠性。

性能方面，在涉及感知、决策与规划的29项核心基准测试中，MiMo-Embodied全面超越现有的开源、闭源及专有模型：在具身智能领域的17项基准测试中取得了最佳成绩，自动驾驶领域的12项基准测试中刷新了最佳记录，同时在通用视觉语言任务上表现出色的泛化能力。

应用与生态建设方面，小米计划首先将MiMo-Embodied应用于自主研发的扫地机器人、工厂自动导引车（AGV）以及高阶智能驾驶系统SU7，并于2026年第一季度起通过OTA更新推送。此外，小米还将开放模型API，为家居、移动出行、制造业的开发者提供跨域智能的基础平台。

(以上内容均由Ai生成)

你可能还想读