Google 宣布推出 Gemini Robotics 公司,用于制造通用机器人
快速阅读: 据《9to5谷歌》称,DeepMind发布Gemini机器人系统,结合Gemini 2.0大模型实现视觉-语言-动作功能,具备通用性、交互性和灵活性,支持多种机器人形态并进行多场景测试,推动通用型机器人发展。
DeepMind今日宣布推出**Gemini机器人系统**,将**Gemini 2.0大模型**与人工智能引入物理世界,新模型能够“执行比以往更广泛的实际任务”。目标是开发通用型机器人,谷歌首席执行官桑达尔·皮查伊补充道,谷歌一直视机器人技术为将人工智能成果应用于物理世界的有益试验场。
**“Gemini机器人系统”**是一款基于**Gemini 2.0**的视觉-语言-动作(VLA)模型,它通过新增物理行为作为输出模式,从而直接控制机器人。在这个过程中,谷歌为机器人的人工智能模型设定了“三个主要特性”:
1. **通用性**:能够适应各种情况。Gemini机器人系统擅长处理新物体、多样化的指令和新环境,包括在训练中未曾遇到的任务,这得益于Gemini对世界的底层理解能力。
2. **交互性**:能够迅速理解和回应指令或环境中的变化。谷歌的新模型能“用日常对话语言及多种语言响应指令”。
3. **灵活性**:能够像人手和手指一样完成各种精细操作。**“Gemini机器人系统”**能够处理极其复杂、多步骤且需要精准操作的任务,例如折纸或把零食装进Ziploc袋子里。
谷歌还推出了增强版的Gemini Robotics-ER(“具身推理”)视觉-语言模型,该模型提升了对空间的理解能力,特别注重空间推理,并使机器人专家能够将其与现有低级控制器结合使用。
这些模型适用于多种机器人形态,包括双臂机器人和人形机器人,并有**敏捷机器人**、**敏捷机器人公司**、**波士顿动力**和**Enchanted Tools**等可信赖的测试者参与。
请将9to5Google添加到您的Google新闻订阅列表中。
FTC提示:我们使用收入分成的自动关联链接。更多信息请参阅原文。
您正在阅读9to5Google——每日报道谷歌及其周边生态系统新闻的专家。务必查看我们的主页获取最新资讯,并关注9to5Google的推特、脸书和领英账号保持更新。如果您不知道从哪里开始,请查看我们的独家报道、评论、教程,并订阅我们的YouTube频道。
(以上内容均由Ai生成)