图 人形机器人使用 Helix VLA 模型演示家务

发布时间:2025年2月22日    来源:szf
图 人形机器人使用 Helix VLA 模型演示家务

快速阅读: 据《机器人报告》称,昨日,Figure AI公司在RoboBusiness活动中展示了其螺旋视觉语言动作(VLA)模型在处理杂货任务中的能力。机器人能独立处理物品,并通过非语言方式协作。Figure AI表示,螺旋VLA模型通过语言定义新技能,能在多机器人协作中实现全身控制和自然语言理解。该技术标志着人形机器人在复杂任务中的显著进步。

昨日,Figure AI公司展示了其螺旋视觉语言动作(VLA)模型在一项简单家务任务中的能力:将杂货放好。在人类给出一个初始提示后,视频中的机器人对场景进行视觉评估,然后合作识别每个物体并将物体移动到厨房的适当位置。视频中有几个值得注意的地方:首先,机器人独立处理放在它们面前的物品,直到显而易见需要将一些物品交给另一方能够触及的目的地。其次,机器人不进行口头交流,但在互动中可以观察到明显的停顿,它们会彼此凝视,这种“心灵感应”的交互显得异常诡异。Figure公司表示,监督AI架构将整体目标分解为更小的子任务,并独立控制每个机器人。这是人类形机器人首次协同工作的展示。Figure展示了Figure人形机器人协作处理杂货的能力。为了完成任务,机器人关闭抽屉,关上冰箱门,并将碗放在操作台的一侧。这些都是对人类来说直观的任务,但并未在请求中具体说明。Figure公司表示,这表明了训练动作的完整性。在另一篇博客文章中,公司解释了演示中机器人所使用的螺旋系统架构。螺旋系统的核心是VLA模型,该模型被认为是所有人形机器人制造商的关键技术。不同方法获取新机器人技能的扩展曲线。在传统的启发式操作中,技能随博士手动编写的技能增长。在传统的机器人模仿学习中,技能随着收集的数据量增长。而在螺旋中,新技能可以通过语言即时定义。| 图片来源:Figure AI《机器人报告》在2023年加州圣克拉拉举办的RoboBusiness活动上,《机器人报告》首次看到了基于大型语言模型的机器人指导的现场演示。在主题演讲中,敏捷机器人公司的首席技术官普拉斯·维尔加帕迪用一段视频震撼了观众,视频展示了Digit人形机器人通过简单的口头命令“清理房间”来清理杂乱的房间。一年半后,Figure螺旋的演示依然令人印象深刻,因为现在它已经在机器人上运行,并且VLA已完全编码和测试。Figure公司表示,它通过收集大约500小时的高质量、多机器人、多操作员的行为数据集生成了VLA。为了生成自然语言条件下的训练对,公司使用了一个自动标记的VLA来生成事后指令。VLA处理来自机器人摄像头的分段视频剪辑并提示:“你会给机器人什么指令才能完成这个视频中的动作?”Figure展示了螺旋的功能。Figure的螺旋VLA模型在机器人和人工智能领域代表了显著的进步,尤其是在如何与之前的VLA模型不同方面。以下是其主要区别:1. 全身控制灵巧性:Figure展示了螺旋VLA模型对整个人形上身提供高速、连续控制的能力。这包括躯干、头部、手腕和单个手指,拥有35度自由度(DoF)。这种灵巧性似乎比之前的模型更复杂和细致地操纵物体。类人运动:能够控制整个上身使螺旋能够以更类人的动作和协调执行任务。例如,它可以跟踪头部以对齐视觉,并调整躯干以达到最佳伸展,同时保持精确的手指动作以抓握。2. 多机器人协作合作任务:Figure展示了螺旋同时在两个机器人上操作,使它们能够合作完成共享任务。这开启了更多复杂和协调的动作的可能性,如两个机器人一起收拾杂货或组装家具。零样本泛化:根据演示设置,机器人合作完成涉及它们从未(据推测)遇到过的物体的任务。如果机器人从未见过这些物体,则表明该模型具有泛化和适应新情况的能力。3. “拿起任何东西”的能力通用物体识别:演示显示了螺旋如何使Figure人形机器人识别和操作各种家用物品。VLA的使用比之前需要针对每个物体进行特定训练的模型有所改进。自然语言提示:机器人展示了对自然语言命令的理解和响应,允许用户指示它“拿起甜点”或“把饼干袋递给你的右边的机器人”,而无需提供详细说明。4. 统一神经网络单一模型适用于所有行为:与之前通常需要为不同任务使用单独模型的方法不同,螺旋似乎使用一组神经网络权重处理所有行为。这简化了模型并使其更加高效。无需针对特定任务进行微调:螺旋可以在不需要为每个特定任务进行微调的情况下执行广泛的任务。Figure公司表示,这使得它更具适应性和易于在不同环境中使用。5. 商业准备就绪:嵌入式处理:螺旋完全运行在Figure 02人形机器人的嵌入式GPU上,功耗低,适合在现实世界中部署,无需依赖外部计算资源。这是使人形机器人在家庭和其他环境中商业化的重要一步。减少延迟:嵌入式处理减少了延迟,使机器人能够快速响应命令并实时与环境互动。生产试验正在进行中。Figure在2024年底宣布,其机器人已从开发和试验阶段转向商业应用,并已向付费客户交付了Figure 02系统。Figure AI因其创新速度获得了2024年RBR50奖。自2023年1月从隐秘状态出现以来,总部位于加利福尼亚州森尼韦尔的公司已经建立并迭代了一款工作的人形机器人,并在其生产线上对其机器人进行了测试。Figure在2024年底宣布,其机器人已从开发和试验阶段转向商业应用,并已向付费客户交付了Figure 02系统。上个月,Figure表示计划认证其机器人的电池、功能安全控制系统和电气系统以符合工业安全标准。该公司还声称,计划在未来四年内出货10万台人形机器人,并据报道正在商谈筹集15亿美元。了解人形机器人在机器人峰会上的情况。人形机器人将在由WTWH媒体主办的机器人峰会与博览会上扮演重要角色。波士顿动力公司的CTO亚伦·桑德斯将在活动第二天发表开幕主题演讲。他将讨论最近重新设计的Atlas机器人,并分享他对未来人形机器人的看法。了解人形机器人在机器人峰会上的情况。展会第一天将举办一场关于人形机器人现状的小组讨论,参与者包括维尔加帕迪;ASTM国际机器人和自主系统总监亚伦·普拉瑟;以及施魏夫勒工程总监阿尔·马克。小组将探讨影响人形机器人发展的技术和业务挑战。它还将分享早期部署的见解、未来的前景以及建立安全标准的持续努力。机器人峰会与博览会将汇集超过5000名专注于为各种商业行业构建机器人的开发者。参会者可以获得有关最新支持技术、工程最佳实践和新兴趋势的洞见。活动将有超过200家参展商,70多位演讲嘉宾,10多个小时的专属网络时间,女性机器人早餐,职业博览会,初创企业展示等。今日注册可享受40%的会议通行证折扣!

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日