谷歌任命 Jules 为代理并传播对 AI 的热爱

快速阅读: 《The Register》消息，在谷歌I/O大会上，谷歌展示了多个AI工具和功能，包括Gemini 2.5 Pro集成、Android Studio代理功能、“拼接”AI设计工具、Chrome AI集成及多项Firebase AI改进。谷歌还推出AI Ultra服务、Gemini Live和Canvas工具，并开源了Gemma模型家族的新成员。

谷歌I/O大会：谷歌技术人员在周二的谷歌I/O大会上展示了一系列极客爱好者喜爱的功能，旨在鼓励软件开发者为其平台和服务付费以构建应用。这一专注开发者的环节紧随谷歌首席执行官桑达尔·皮查伊的主题演讲之后。在皮查伊以销售方式概述了公司的成就后，他的软件和硬件专家轮番登台，在硅谷核心地带山景城的滨岸露天剧场，向聚集的观众展示了谷歌工具和基础设施能实现的应用类型。

谷歌实验室副总裁乔什·伍德沃德通过演示“拼接”（Stitch）拉开了头脑风暴的序幕。这是一个用于创建网页和移动应用程序用户界面设计的实验性人工智能服务。

“这是拼接，”他说，“它从设计开始。你可以直接粘贴提示，例如‘给我做一个发现加利福尼亚州的应用程序，包括活动和旅行路线’。然后你只需点击生成设计，它就会开始为你制作设计。”

结果可以导出为CSS/HTML格式，或导入Figma进行进一步优化。拼接提供了谷歌Gemini 2.5 Pro和Gemini 2.5 Flash AI模型的选择，这些模型在主主题演讲中因其能力而受到庆祝。其中包括支持实时用24种语言听和说的能力。

谷歌的异步编码代理“朱尔斯”（Jules）已经进入了公开测试阶段。尽管无需人工监督，但最终仍需由开发者创建合并请求来整合AI编写的更改。

谷歌的Gemini 2.5 Pro模型已集成到Android Studio中，这带来了两种代理功能：“旅程”，使Gemini能够进行应用测试；以及版本升级代理，自动将依赖项更新到最新兼容版本，并构建项目以捕获和解决可能因依赖项变化而出现的错误。

Android开发者还获得了访问ML Kit GenAI API的权限，允许使用Gemini Nano进行设备端任务。

网络开发者感受到了谷歌的支持，因为有了新的CSS原语，仅需几行CSS和HTML代码就能构建轮播图。根据谷歌的说法，Pinterest测试了这项网络技术，并看到轮播图代码减少了90%，从约2000行代码减少到200行。

“不仅应该而且应该轻松地创建美观、可访问、声明式的跨浏览器用户界面，”谷歌Chrome的工作人员开发关系工程师乌娜·克拉维茨说。

同样地，现在有一个兴趣调用API，作为试验起源提供，用于切换弹出菜单的存在与否，当访问者对网站的特定部分表现出兴趣时。谷歌通过演示这个API，结合锚点定位API和弹出菜单API，展示了当网站访问者悬停在显示礼堂的图形上时，如何显示剧院座位的价格。

GitHub Copilot努力从助手角色提升为代理角色。

大型语言模型（LLM）不断制造软件依赖项并导致问题。

人工智能能够改进自己编写的代码，但你需要知道如何提问。

要在你的应用中嵌入定制提示的LLM吗？当然！以下是如何开始的。

技术人员提议了代理名称服务：类似于DNS，但专用于人工智能代理。

与此同时，Chrome开发者工具现在集成了Gemini。

人工智能辅助功能可用于加速样式设计、性能优化及调试工作。

随着周一Chrome 138的发布，参与谷歌早期预览计划的网络开发人员可以尝试由Gemini Nano启用的内置（客户端）人工智能功能。

Chrome 138稳定版中提供了Summarizer API、Language Detector API、Translator API以及Chrome扩展程序的Prompt API。Writer和Rewriter API可在试验起源中访问，Proofreader API和具有多模态功能的Prompt API可在Chrome 138金丝雀版本中测试。

Firebase获得了多项与人工智能相关的改进，包括支持Figma导入。

说到谷歌……

以下是我们在I/O活动中注意到的其他亮点：

谷歌推出了AI Ultra服务，每月订阅费用为250美元，提供最高使用限制，可访问网络巨头最强大的模型；首先在美国推出。其中包括Gemini 2.5 Pro中的深度推理模式、30TB存储空间以及YouTube Premium。

Gemini正在Chrome中推出Windows和macOS桌面版本，但有几点需要注意：它将提供给使用英语作为Chrome语言设置的美国谷歌AI Pro和谷歌AI Ultra订阅者。

更多Gemini——这次是Gemini Live，它可以通过你的手机摄像头和屏幕共享实时回答查询。

还有一个深度研究生成器，用于整合公共和私人报告，以及一种类似氛围编码的工具Canvas，用于生成交互式信息图表、测验等。

Gemini Code Assist for个人用户，这是谷歌AI编码助手的一个免费版本，于今年2月进入公测阶段，现已进入通用可用性阶段。还有付费版本，两者现在都由Gemini 2.5 Pro提供支持。

谷歌Colab，一个云托管的Jupyter Notebook环境，用于数据科学和Python魔法，也得到了一个人工智能改造。

Colab AI正在逐步推出，承诺通过Gemini 2.5 Flash提供代理助手功能。

为了避免被谷歌专有的Gemini模型掩盖，公司开源模型家族Gemma也获得了一些新成员。有Gemma 3n，这是一个预览模型，能在最低2GB内存下运行；MedGemma，用于多模态医学文本和图像理解。即将推出的是SignGemm，这是一种手语理解模型，以及DolphinGemma，“世界上第一个为海豚设计的大语言模型”。

那些尖锐的叫声和咔哒声？那是海豚在表达‘感谢塑料’的意思。

(以上内容均由Ai生成)