图 人形机器人使用 Helix VLA 模型演示家务
快速阅读: 据《机器人报告》称,昨日,Figure AI公司在RoboBusiness活动中展示了其螺旋视觉语言动作(VLA)模型在处理杂货任务中的能力。机器人能独立处理物品,并通过非语言方式协作。Figure AI表示,螺旋VLA模型通过语言定义新技能,能在多机器人协作中实现全身控制和自然语言理解。该技术标志着人形机器人在复杂任务中的显著进步。
昨日,Figure AI公司展示了其螺旋视觉语言动作(VLA)模型在一项简单家务任务中的能力:将杂货放好。在人类给出一个初始提示后,视频中的机器人对场景进行视觉评估,然后合作识别每个物体并将物体移动到厨房的适当位置。视频中有几个值得注意的地方:首先,机器人独立处理放在它们面前的物品,直到显而易见需要将一些物品交给另一方能够触及的目的地。其次,机器人不进行口头交流,但在互动中可以观察到明显的停顿,它们会彼此凝视,这种“心灵感应”的交互显得异常诡异。Figure公司表示,监督AI架构将整体目标分解为更小的子任务,并独立控制每个机器人。这是人类形机器人首次协同工作的展示。Figure展示了Figure人形机器人协作处理杂货的能力。为了完成任务,机器人关闭抽屉,关上冰箱门,并将碗放在操作台的一侧。这些都是对人类来说直观的任务,但并未在请求中具体说明。Figure公司表示,这表明了训练动作的完整性。在另一篇博客文章中,公司解释了演示中机器人所使用的螺旋系统架构。螺旋系统的核心是VLA模型,该模型被认为是所有人形机器人制造商的关键技术。不同方法获取新机器人技能的扩展曲线。在传统的启发式操作中,技能随博士手动编写的技能增长。在传统的机器人模仿学习中,技能随着收集的数据量增长。而在螺旋中,新技能可以通过语言即时定义。| 图片来源:Figure AI《机器人报告》在2023年加州圣克拉拉举办的RoboBusiness活动上,《机器人报告》首次看到了基于大型语言模型的机器人指导的现场演示。在主题演讲中,敏捷机器人公司的首席技术官普拉斯·维尔加帕迪用一段视频震撼了观众,视频展示了Digit人形机器人通过简单的口头命令“清理房间”来清理杂乱的房间。一年半后,Figure螺旋的演示依然令人印象深刻,因为现在它已经在机器人上运行,并且VLA已完全编码和测试。Figure公司表示,它通过收集大约500小时的高质量、多机器人、多操作员的行为数据集生成了VLA。为了生成自然语言条件下的训练对,公司使用了一个自动标记的VLA来生成事后指令。VLA处理来自机器人摄像头的分段视频剪辑并提示:“你会给机器人什么指令才能完成这个视频中的动作?”Figure展示了螺旋的功能。Figure的螺旋VLA模型在机器人和人工智能领域代表了显著的进步,尤其是在如何与之前的VLA模型不同方面。以下是其主要区别:1. 全身控制灵巧性:Figure展示了螺旋VLA模型对整个人形上身提供高速、连续控制的能力。这包括躯干、头部、手腕和单个手指,拥有35度自由度(DoF)。这种灵巧性似乎比之前的模型更复杂和细致地操纵物体。类人运动:能够控制整个上身使螺旋能够以更类人的动作和协调执行任务。例如,它可以跟踪头部以对齐视觉,并调整躯干以达到最佳伸展,同时保持精确的手指动作以抓握。2. 多机器人协作合作任务:Figure展示了螺旋同时在两个机器人上操作,使它们能够合作完成共享任务。这开启了更多复杂和协调的动作的可能性,如两个机器人一起收拾杂货或组装家具。零样本泛化:根据演示设置,机器人合作完成涉及它们从未(据推测)遇到过的物体的任务。如果机器人从未见过这些物体,则表明该模型具有泛化和适应新情况的能力。3. “拿起任何东西”的能力通用物体识别:演示显示了螺旋如何使Figure人形机器人识别和操作各种家用物品。VLA的使用比之前需要针对每个物体进行特定训练的模型有所改进。自然语言提示:机器人展示了对自然语言命令的理解和响应,允许用户指示它“拿起甜点”或“把饼干袋递给你的右边的机器人”,而无需提供详细说明。4. 统一神经网络单一模型适用于所有行为:与之前通常需要为不同任务使用单独模型的方法不同,螺旋似乎使用一组神经网络权重处理所有行为。这简化了模型并使其更加高效。无需针对特定任务进行微调:螺旋可以在不需要为每个特定任务进行微调的情况下执行广泛的任务。Figure公司表示,这使得它更具适应性和易于在不同环境中使用。5. 商业准备就绪:嵌入式处理:螺旋完全运行在Figure 02人形机器人的嵌入式GPU上,功耗低,适合在现实世界中部署,无需依赖外部计算资源。这是使人形机器人在家庭和其他环境中商业化的重要一步。减少延迟:嵌入式处理减少了延迟,使机器人能够快速响应命令并实时与环境互动。生产试验正在进行中。Figure在2024年底宣布,其机器人已从开发和试验阶段转向商业应用,并已向付费客户交付了Figure 02系统。Figure AI因其创新速度获得了2024年RBR50奖。自2023年1月从隐秘状态出现以来,总部位于加利福尼亚州森尼韦尔的公司已经建立并迭代了一款工作的人形机器人,并在其生产线上对其机器人进行了测试。Figure在2024年底宣布,其机器人已从开发和试验阶段转向商业应用,并已向付费客户交付了Figure 02系统。上个月,Figure表示计划认证其机器人的电池、功能安全控制系统和电气系统以符合工业安全标准。该公司还声称,计划在未来四年内出货10万台人形机器人,并据报道正在商谈筹集15亿美元。了解人形机器人在机器人峰会上的情况。人形机器人将在由WTWH媒体主办的机器人峰会与博览会上扮演重要角色。波士顿动力公司的CTO亚伦·桑德斯将在活动第二天发表开幕主题演讲。他将讨论最近重新设计的Atlas机器人,并分享他对未来人形机器人的看法。了解人形机器人在机器人峰会上的情况。展会第一天将举办一场关于人形机器人现状的小组讨论,参与者包括维尔加帕迪;ASTM国际机器人和自主系统总监亚伦·普拉瑟;以及施魏夫勒工程总监阿尔·马克。小组将探讨影响人形机器人发展的技术和业务挑战。它还将分享早期部署的见解、未来的前景以及建立安全标准的持续努力。机器人峰会与博览会将汇集超过5000名专注于为各种商业行业构建机器人的开发者。参会者可以获得有关最新支持技术、工程最佳实践和新兴趋势的洞见。活动将有超过200家参展商,70多位演讲嘉宾,10多个小时的专属网络时间,女性机器人早餐,职业博览会,初创企业展示等。今日注册可享受40%的会议通行证折扣!
(以上内容均由Ai生成)