OpenAI发布ChatGPT新功能:智能体可自主完成任务
快速阅读: 相关媒体消息,7月17日,OpenAI推出ChatGPT Agent系统,结合Operator和Deep Research技术,提升任务处理能力。Pro用户每月可使用400次。
据澎湃新闻报道,7月17日,美国旧金山,人工智能巨头OpenAI推出了ChatGPT智能体(Agent)系统。OpenAI首席执行官山姆·奥特曼(Sam Altman)及四位负责人进行了25分钟的直播介绍。
这套系统融合了Operator远程浏览器执行能力和Deep Research网络信息整合技术,加上ChatGPT的对话优势,形成了一个统一的智能体平台。奥特曼表示,智能体代表了AI系统能力的新高度。
此前,Operator和Deep Research各自拥有不同的优势:Operator能够在网页上处理内容,而Deep Research则擅长分析和汇总信息。然而,Operator无法进行深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需用户身份验证的内容。此次,OpenAI将两者的优点结合,使ChatGPT在Agent模式下能够使用“虚拟电脑”执行任务,根据用户指令处理复杂工作,并能主动与网站互动。
在发布会上,OpenAI展示了ChatGPT Agent同时进行购买西装、制作贴纸、预订酒店等任务的过程。Agent使用虚拟电脑后,会询问用户的明确需求,然后进行商品挑选、浏览网页、点击详情页,并给出建议。此外,Agent还可以代替用户完成下单操作。
在“虚拟电脑”环境中,即使ChatGPT使用多种工具,也能保持任务所需上下文。用户可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,在终端运行命令,然后查看输出结果。同时,ChatGPT在执行关键操作前会请求用户权限,用户可以随时中断、控制浏览器或停止任务。用户还可以设置已完成功能的自动重复执行,如每周一上午生成周报。
在“人类最后一次考试”评估中,ChatGPT Agent的最先进水平得分为41.6,采用简单并行部署策略后,得分提高到44.4。此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也显著优于之前的模型。
目前,Pro、Plus和Team用户可以使用Agent模式,企业版和教育版用户将在未来几周内获得访问权限。Pro用户每月可使用400次,其他付费用户每月可使用40次,也可付费增加使用次数。
(以上内容均由AI生成)