OpenAI 推出 ChatGPT 代理以自动执行多步骤浏览器任务

发布时间：2025年7月18日来源：szf

快速阅读: 据《硅角度》称，OpenAI推出ChatGPT代理，可自动化多云应用任务，支持文本与图形界面操作，提升效率并保障安全。在数学与电子表格测试中表现优异。

据OpenAI官方消息，今天，该公司发布了一款名为ChatGPT代理的新产品，能够在用户的浏览器中执行复杂的任务。这款代理由一个经过优化的新AI模型驱动，性能超越了OpenAI之前的系统。

ChatGPT代理的主要功能是自动化那些需要用户在多个云应用间操作的任务。例如，开发人员可以使用它从GitHub下载代码文件，并将其保存至Google Drive文件夹中。此外，ChatGPT代理还能在保存前对文件进行漏洞扫描。

为了实现与在线服务的交互，ChatGPT代理使用了两种不同的浏览器。一种主要用于处理文本，支持基于简单推理的网页查询；另一种则允许代理通过图形界面与网站互动，如同真实用户一样操作。

在执行涉及敏感信息的操作前，ChatGPT代理会先征求用户的许可。同时，OpenAI建议用户在代理执行任务时进行监督，确保过程的安全性。代理还具备停止任务、手动干预或接收新指令的能力。

除了与浏览器互动外，ChatGPT代理还能与终端程序协作，后者是一种用于通过脚本与操作系统交互的工具。代理可以通过终端执行编辑文件等任务。

OpenAI的技术团队表示：“该模型能够选择使用文本浏览器或视觉浏览器打开页面，下载网络文件，在终端执行命令，最后将结果返回给视觉浏览器。”

在内部测试中，ChatGPT代理在FrontierMath数学基准测试中取得了27.4%的成绩，而o4-mini和o4分别获得了19.3%和10.3%的分数。在SpreadsheetBench电子表格能力测试中，ChatGPT代理的表现也超过了Microsoft Copilot版本25%。

为防止ChatGPT代理被恶意利用，OpenAI实施了一系列安全措施，特别是针对隐藏在网页中的恶意提示进行了专门的训练和测试。公司员工解释说：“我们已训练并测试了代理来识别和抵御提示注入攻击，并通过持续监控快速检测和响应此类攻击。”

目前，ChatGPT代理已上线，用户可以在ChatGPT的Pro、Plus和Team订阅层级中体验这一新功能。

(以上内容均由Ai生成)

你可能还想读