OpenAI 推出 ChatGPT 代理以自动执行多步骤浏览器任务
快速阅读: 据《硅角度》称,OpenAI推出ChatGPT代理,可自动化多云应用任务,支持文本与图形界面操作,提升效率并保障安全。在数学与电子表格测试中表现优异。
据OpenAI官方消息,今天,该公司发布了一款名为ChatGPT代理的新产品,能够在用户的浏览器中执行复杂的任务。这款代理由一个经过优化的新AI模型驱动,性能超越了OpenAI之前的系统。
ChatGPT代理的主要功能是自动化那些需要用户在多个云应用间操作的任务。例如,开发人员可以使用它从GitHub下载代码文件,并将其保存至Google Drive文件夹中。此外,ChatGPT代理还能在保存前对文件进行漏洞扫描。
为了实现与在线服务的交互,ChatGPT代理使用了两种不同的浏览器。一种主要用于处理文本,支持基于简单推理的网页查询;另一种则允许代理通过图形界面与网站互动,如同真实用户一样操作。
在执行涉及敏感信息的操作前,ChatGPT代理会先征求用户的许可。同时,OpenAI建议用户在代理执行任务时进行监督,确保过程的安全性。代理还具备停止任务、手动干预或接收新指令的能力。
除了与浏览器互动外,ChatGPT代理还能与终端程序协作,后者是一种用于通过脚本与操作系统交互的工具。代理可以通过终端执行编辑文件等任务。
OpenAI的技术团队表示:“该模型能够选择使用文本浏览器或视觉浏览器打开页面,下载网络文件,在终端执行命令,最后将结果返回给视觉浏览器。”
在内部测试中,ChatGPT代理在FrontierMath数学基准测试中取得了27.4%的成绩,而o4-mini和o4分别获得了19.3%和10.3%的分数。在SpreadsheetBench电子表格能力测试中,ChatGPT代理的表现也超过了Microsoft Copilot版本25%。
为防止ChatGPT代理被恶意利用,OpenAI实施了一系列安全措施,特别是针对隐藏在网页中的恶意提示进行了专门的训练和测试。公司员工解释说:“我们已训练并测试了代理来识别和抵御提示注入攻击,并通过持续监控快速检测和响应此类攻击。”
目前,ChatGPT代理已上线,用户可以在ChatGPT的Pro、Plus和Team订阅层级中体验这一新功能。
(以上内容均由Ai生成)