Google Robotics – 早期
快速阅读: 据《Radio Free Mobile》称,谷歌推出On-Device VLA模型,使AI在机器人本地运行成为可能,但泛化能力有限,需大量训练。AI缺乏因果理解,限制通用机器人发展,市场成熟仍需时日。
边缘计算中AI的另一个应用场景。谷歌最新发布的成果展示了在设备上运行AI的一个重大应用场景,但仍然存在许多不足之处,因此这一巨大的机遇可能要过很多年才能实现。
谷歌推出了Gemini Robotics On-Device,这是一种视觉-语言-动作(VLA)模型,该模型经过优化,可以在本地运行,而不是在云端。这表明当部署机器人时,边缘计算运行AI将变得多么重要。这是有两个原因:首先,延迟问题。因为实时机器人对延迟非常敏感,它们需要能够实时做出反应。例如,一个机器人拿起玻璃杯时,需要知道施加多大的压力才能防止杯子滑落,但又不能太大以至于杯子破碎。这个任务几乎没有任何容错空间,这意味着这类决策必须由机器人内部的AI系统来完成,而不是依赖云端处理。其次,可靠性。机器人在出现网络中断时仍需能够继续运行。比如那些花费数千美元购买家庭机器人的用户,不会愿意回家后因为家里路由器坏了而吃上烧焦的食物。此外,家用机器人需要是安全的,如果机器人在楼梯上卡住、翻倒并压到老人的情况也是无法接受的。简单的解决办法是在机器人上运行关键系统,随着小型模型能力的提升,这种在机器人上运行关键系统的做法正变得越来越现实。
接着,谷歌进一步讨论了On-Device VLA模型的泛化能力,而正是在这里,我的疑虑开始产生。例如,这个模型仅针对双臂机器人进行训练,真正的泛化意味着它能够处理不同数量和配置的手臂和腿。此外,当这个模型被应用到其他双臂机器人时,需要重新训练才能完成特定任务。例如,这个模型仅针对双臂机器人进行训练,真正的泛化意味着它能够处理不同数量和配置的手臂和腿。因此,谷歌所说的“泛化模型”实际上是指提供了一个通用的起点,但为了适应不同的配置和任务,还需要大量的训练。这并不是因为谷歌的问题,而是因为AI模型使用统计模式识别来做决策和/或执行任务的性质所致。这就是RFM研究长期存在的问题——因果关系,直到这个问题得到显著改善,真正通用的机器人模型才有可能实现。这意味着大规模生产机器人在经济上不可行,进而会推迟市场的成熟。
这并不意味着现在没有机器人市场(如工厂、智能的家庭吸尘器等),但这确实意味着真正的大机会仍然很遥远。大型语言模型(LLMs)的出现使机器人在可行性方面进入了人们的视野,因为语音和自然语言现在成为人与机器之间良好的用户界面,这也是为什么人们对这一领域越来越感兴趣的原因。但是,对于时间表,我们需要保持现实。机器人正在到来,但它们的步伐非常缓慢。
(以上内容均由Ai生成)