机器人利用 Google 的 Gemini AI 从简单的指令中折叠折纸
快速阅读: 《技术点》消息,DeepMind推出Gemini Robotics,升级版语言模型助力机器人获得新能力。Gemini Robotics旨在打造通用AI系统,提升机器人的灵活性、互动性和灵巧性。通过简单指令,机器人可适应新情境并完成复杂任务。目前该项目处于研究阶段,与Apptronik合作开发硬件。深度思维采用基于阿西莫夫定律的安全评估标准,确保AI模型理解机器人行为的广泛后果。
总体来看:
尽管企业在持续改进机器人硬件,但开发能让这些机器真正“活”起来的AI软件依然是一项极具挑战性的目标。鉴于“智能”语言模型的巨大进步,这一点尤其令人感到遗憾。如今,谷歌的AI研究实验室比以往任何时候都更接近于缩小这一差距。
**深度思维(DeepMind)推出了Gemini Robotics**,这是其强大的Gemini 2.0语言模型的升级版本,有望为机器人解锁全新的能力。
**Gemini Robotics**的目标是打造一个通用的AI系统,能够直接操控机器人,并帮助它们掌握灵活性、互动性和灵巧性的三重能力。结果将是机器人可以适应新情境,自然地响应人类及环境,并完成复杂的物理任务。
深度思维推出了Gemini Robotics,这是其强大的Gemini 2.0语言模型的进阶版本,可能为机器人开启全新能力的大门。
并且,他们在稳步取得进展。观看深度思维的双臂机器人ALOHA 2展示技能的视频即可知晓。它不仅能精准折叠折纸图案,甚至在事情偏离预期时也能随机应变——例如,当研究人员移动了它本应放置水果的容器时。
最令人惊叹的是,这一切仅需通过简单的指令如“折叠一只折纸狐狸”即可完成。研究人员无需手动编写这项能力——机器人只是利用了它对折纸以及如何折叠纸张的理解完成了任务。
当然,折纸只是个开端。深度思维声称,**Gemini Robotics**标志着在所有三项关键机器人能力上取得了重大突破,相较其前身,在通用任务基准上的表现超过了其他最先进的系统的两倍以上。
并非首次:朝鲜黑客曾多次利用虚假应用程序在安卓设备上分发间谍软件。
工厂开始试验能够自行建造更多同类人形机器人的生产线。
这意味着什么?**Gemini Robotics**可能会催生新一代的机器人,能够在无需针对每个场景进行定制训练的情况下,概括并适应不可预测的现实世界情况。这种多功能性对未来开发真正实用的通用机器人至关重要。
为了实现这一潜力,谷歌还与一家名为**Apptronik**的公司展开合作。**Apptronik**将通过构建由**Gemini**驱动的下一代人形机器人负责硬件部分。
不过,不要期待很快能雇佣到Gemini机器人管家。目前,深度思维仍保持该项目处于研究阶段,发布了一个“**Gemini Robotics-ER**”系统,允许像**波士顿动力**这样的“可信测试者”访问AI的推理能力以应用于自身项目。“**ER**”代表具身推理。
可信测试者可能包括**波士顿动力**、**敏捷机器人**和**魔法工具**等公司。
当然,由先进AI驱动的现实世界机器人引发了重要的安全问题。深度思维表示,它采取了一种受阿西莫夫机器人定律启发的整体方法,并通过新的“**ASIMOV**”数据集开发评估标准。目标是测试AI模型是否理解机器人行为的更广泛后果,而不仅仅局限于身体伤害。
(以上内容均由Ai生成)