Google Robotics – 早期

发布时间：2025年6月25日来源：szf

快速阅读: 据《Radio Free Mobile》称，谷歌推出On-Device VLA模型，使AI在机器人本地运行成为可能，但泛化能力有限，需大量训练。AI缺乏因果理解，限制通用机器人发展，市场成熟仍需时日。

边缘计算中AI的另一个应用场景。谷歌最新发布的成果展示了在设备上运行AI的一个重大应用场景，但仍然存在许多不足之处，因此这一巨大的机遇可能要过很多年才能实现。

谷歌推出了Gemini Robotics On-Device，这是一种视觉-语言-动作（VLA）模型，该模型经过优化，可以在本地运行，而不是在云端。这表明当部署机器人时，边缘计算运行AI将变得多么重要。这是有两个原因：首先，延迟问题。因为实时机器人对延迟非常敏感，它们需要能够实时做出反应。例如，一个机器人拿起玻璃杯时，需要知道施加多大的压力才能防止杯子滑落，但又不能太大以至于杯子破碎。这个任务几乎没有任何容错空间，这意味着这类决策必须由机器人内部的AI系统来完成，而不是依赖云端处理。其次，可靠性。机器人在出现网络中断时仍需能够继续运行。比如那些花费数千美元购买家庭机器人的用户，不会愿意回家后因为家里路由器坏了而吃上烧焦的食物。此外，家用机器人需要是安全的，如果机器人在楼梯上卡住、翻倒并压到老人的情况也是无法接受的。简单的解决办法是在机器人上运行关键系统，随着小型模型能力的提升，这种在机器人上运行关键系统的做法正变得越来越现实。

接着，谷歌进一步讨论了On-Device VLA模型的泛化能力，而正是在这里，我的疑虑开始产生。例如，这个模型仅针对双臂机器人进行训练，真正的泛化意味着它能够处理不同数量和配置的手臂和腿。此外，当这个模型被应用到其他双臂机器人时，需要重新训练才能完成特定任务。例如，这个模型仅针对双臂机器人进行训练，真正的泛化意味着它能够处理不同数量和配置的手臂和腿。因此，谷歌所说的“泛化模型”实际上是指提供了一个通用的起点，但为了适应不同的配置和任务，还需要大量的训练。这并不是因为谷歌的问题，而是因为AI模型使用统计模式识别来做决策和/或执行任务的性质所致。这就是RFM研究长期存在的问题——因果关系，直到这个问题得到显著改善，真正通用的机器人模型才有可能实现。这意味着大规模生产机器人在经济上不可行，进而会推迟市场的成熟。

这并不意味着现在没有机器人市场（如工厂、智能的家庭吸尘器等），但这确实意味着真正的大机会仍然很遥远。大型语言模型（LLMs）的出现使机器人在可行性方面进入了人们的视野，因为语音和自然语言现在成为人与机器之间良好的用户界面，这也是为什么人们对这一领域越来越感兴趣的原因。但是，对于时间表，我们需要保持现实。机器人正在到来，但它们的步伐非常缓慢。

(以上内容均由Ai生成)