Nvidia 推出专为自动驾驶设计的 Alpamayo-R1 模型
快速阅读: NVIDIA 在 NeurIPS 大会推出 Alpamayo-R1,首款专为自动驾驶设计的开放推理视觉语言模型,基于 Cosmos-Reason,帮助车辆理解环境并作出决策,同时发布 Cosmos Cookbook 助力开发者。
近日,NVIDIA 在加州圣地亚哥举行的 NeurIPS AI 大会上宣布了一系列新的基础设施和 AI 模型,旨在为物理 AI 的发展奠定基础,其中包括可以感知并与现实世界互动的机器人和自动驾驶车辆。
其中最引人注目的是 Alpamayo-R1,这是一款专为自动驾驶研究设计的开放推理视觉语言模型。NVIDIA 称这是首个专注于自动驾驶的视觉语言行为模型,能够处理文本和图像,帮助车辆“看到”周围环境并作出相应的决策。
Alpamayo-R1 模型基于 NVIDIA 的 Cosmos-Reason 模型,后者专注于在作出响应前进行思考和推理。NVIDIA 在 2025 年 1 月首次发布了 Cosmos 模型系列,并在 8 月推出了更多模型。公司表示,Alpamayo-R1 的推出对于那些希望实现四级自动驾驶(在特定区域和条件下完全自主)的大型企业至关重要。
NVIDIA 希望这一推理模型能够赋予自动驾驶汽车类似人类的“常识”,以更好地处理复杂的驾驶决策。此外,NVIDIA 还在 GitHub 上发布了一系列新资源,包括逐步指南、推理资源和后续训练工作流程,统称为 Cosmos Cookbook,旨在帮助开发者更好地使用和训练 Cosmos 模型,内容涵盖数据整理、合成数据生成和模型评估。
这些新举措表明 NVIDIA 正全力推进物理 AI 领域的发展,以其先进的 AI GPU 为支撑。NVIDIA 的联合创始人兼首席执行官黄仁勋多次表示,物理 AI 将是 AI 发展的下一个浪潮。NVIDIA 首席科学家 Bill Dally 也在夏季与 TechCrunch 的对话中强调了物理 AI 在机器人领域的重要性。他指出,未来机器人将在世界上扮演重要角色,而 NVIDIA 希望成为所有机器人的“大脑”制造者,因此必须开发关键技术。
【要点】
– 🌟 NVIDIA 推出了 Alpamayo-R1,这是首款专为自动驾驶设计的开放推理视觉语言模型。
– 🚗 该模型基于 Cosmos-Reason,旨在帮助车辆更好地理解周围环境并作出决策。
– 📚 同时,NVIDIA 提供了 Cosmos Cookbook,助力开发者有效训练和使用 AI 模型。
(以上内容均由Ai生成)