机器人利用 Google 的 Gemini AI 从简单的指令中折叠折纸

发布时间：2025年3月14日来源：szf

快速阅读: 《技术点》消息，DeepMind推出Gemini Robotics，升级版语言模型助力机器人获得新能力。Gemini Robotics旨在打造通用AI系统，提升机器人的灵活性、互动性和灵巧性。通过简单指令，机器人可适应新情境并完成复杂任务。目前该项目处于研究阶段，与Apptronik合作开发硬件。深度思维采用基于阿西莫夫定律的安全评估标准，确保AI模型理解机器人行为的广泛后果。

总体来看：
尽管企业在持续改进机器人硬件，但开发能让这些机器真正“活”起来的AI软件依然是一项极具挑战性的目标。鉴于“智能”语言模型的巨大进步，这一点尤其令人感到遗憾。如今，谷歌的AI研究实验室比以往任何时候都更接近于缩小这一差距。

**深度思维（DeepMind）推出了Gemini Robotics**，这是其强大的Gemini 2.0语言模型的升级版本，有望为机器人解锁全新的能力。

**Gemini Robotics**的目标是打造一个通用的AI系统，能够直接操控机器人，并帮助它们掌握灵活性、互动性和灵巧性的三重能力。结果将是机器人可以适应新情境，自然地响应人类及环境，并完成复杂的物理任务。

深度思维推出了Gemini Robotics，这是其强大的Gemini 2.0语言模型的进阶版本，可能为机器人开启全新能力的大门。

并且，他们在稳步取得进展。观看深度思维的双臂机器人ALOHA 2展示技能的视频即可知晓。它不仅能精准折叠折纸图案，甚至在事情偏离预期时也能随机应变——例如，当研究人员移动了它本应放置水果的容器时。

最令人惊叹的是，这一切仅需通过简单的指令如“折叠一只折纸狐狸”即可完成。研究人员无需手动编写这项能力——机器人只是利用了它对折纸以及如何折叠纸张的理解完成了任务。

当然，折纸只是个开端。深度思维声称，**Gemini Robotics**标志着在所有三项关键机器人能力上取得了重大突破，相较其前身，在通用任务基准上的表现超过了其他最先进的系统的两倍以上。

并非首次：朝鲜黑客曾多次利用虚假应用程序在安卓设备上分发间谍软件。

工厂开始试验能够自行建造更多同类人形机器人的生产线。

这意味着什么？**Gemini Robotics**可能会催生新一代的机器人，能够在无需针对每个场景进行定制训练的情况下，概括并适应不可预测的现实世界情况。这种多功能性对未来开发真正实用的通用机器人至关重要。

为了实现这一潜力，谷歌还与一家名为**Apptronik**的公司展开合作。**Apptronik**将通过构建由**Gemini**驱动的下一代人形机器人负责硬件部分。

不过，不要期待很快能雇佣到Gemini机器人管家。目前，深度思维仍保持该项目处于研究阶段，发布了一个“**Gemini Robotics-ER**”系统，允许像**波士顿动力**这样的“可信测试者”访问AI的推理能力以应用于自身项目。“**ER**”代表具身推理。

可信测试者可能包括**波士顿动力**、**敏捷机器人**和**魔法工具**等公司。

当然，由先进AI驱动的现实世界机器人引发了重要的安全问题。深度思维表示，它采取了一种受阿西莫夫机器人定律启发的整体方法，并通过新的“**ASIMOV**”数据集开发评估标准。目标是测试AI模型是否理解机器人行为的更广泛后果，而不仅仅局限于身体伤害。

(以上内容均由Ai生成)

机器人利用 Google 的 Gemini AI 从简单的指令中折叠折纸

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

谷歌Gemini 3 Pro发布

独具创新，直击痛点：深度解析华为十大最新方案

Palantir估值承压仍领跑AI赛道

Palantir与Snowflakes深化AI合作

Palantir与迪拜控股共建AI公司

Palantir携手Lumen共建企业AI平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台