Google 的新机器人 AI 可以在没有云的情况下运行,并且仍然可以系鞋带
快速阅读: 《Ars Technica》消息,谷歌DeepMind推出本地VLA模型,无需云端即可让机器人自主运行。该模型基于Gemini,具备更强泛化能力,适用于多种任务。
我们有时会将像Gemini和ChatGPT这样的聊天机器人称为“机器人”,但生成式人工智能在真正的物理机器人中也发挥着越来越重要的作用。在今年早些时候宣布了Gemini Robotics之后,Google DeepMind现在推出了一种新的本地设备VLA(视觉语言动作)模型,用于控制机器人。与之前的版本不同,这次没有云组件,使机器人能够完全自主运行。Google DeepMind机器人部门主管卡罗利娜·帕拉达表示,这种人工智能机器人的方法可以让机器人在困难情况下更加可靠。这也是Google机器人模型的第一个版本,开发者可以对其进行调优以适应其特定用途。
机器人对人工智能来说是一个独特的问题,因为机器人不仅存在于物理世界中,还会影响其环境。无论你是让它移动积木还是系鞋带,都很难预测机器人可能遇到的所有情况。传统的通过强化学习训练机器人执行任务的方法非常缓慢,但生成式人工智能可以实现更大的泛化能力。卡罗利娜·帕拉达解释道:“它依托Gemini的多模态世界理解能力来完成一个全新的任务。这意味着,就像Gemini可以生成文字、写诗、总结文章一样,你也可以编写代码,还可以生成图像。它还能生成机器人动作。”
通用机器人无需云端
在之前发布的Gemini Robotics(仍然是Google机器人技术的“最佳”版本)中,平台采用的是混合系统,即机器人上运行一个小模型,而云端运行一个更大的模型。你可能见过聊天机器人“思考”数秒后才生成输出,但机器人需要快速反应。如果你告诉机器人拿起并移动一个物体,你不希望它在每一步生成时停下来。本地模型允许快速适应,而基于服务器的模型则有助于处理复杂的推理任务。Google DeepMind现在将本地模型作为独立的VLA释放出来,其表现令人惊讶地稳健。
(以上内容均由Ai生成)