OpenAI 发布最强 ChatGPT:上网、编程、做 PPT 无所不能
快速阅读: 据相关媒体最新报道,OpenAI推出ChatGPT Agent,可执行多种任务,如生成演示文稿、安排会议等。它结合了多个工具功能,支持连接Gmail、GitHub等应用,并在多项测试中表现优异。
据OpenAI公司今日凌晨宣布,将在ChatGPT中推出一款通用型AI智能体,这款智能体能够帮助用户完成各种基于计算机的任务。OpenAI表示,这款智能体可以自动生成可编辑的演示文稿和幻灯片,查看用户的日历以简要介绍即将举行的客户会议,计划并购买制作家庭早餐的食材,以及运行代码等。
这款工具名为ChatGPT Agent,结合了OpenAI之前多种智能体工具的功能,包括Operator点击网站的能力和Deep Research从多个网站中综合信息生成简洁研究报告的能力。用户只需通过自然语言提示ChatGPT即可与该智能体进行交互。
为了开发这一新工具,OpenAI将其背后的Operator和Deep Research团队合并为一个统一的团队,该团队由产品和研究部门共20至35人组成。OpenAI表示,ChatGPT Agent比其之前的产品更为强大,可以访问ChatGPT连接器,允许用户连接Gmail和GitHub等应用,并且可以根据用户的提示找到相关信息。此外,ChatGPT Agent还可以访问终端,使用API来访问某些应用。
根据OpenAI的说法,ChatGPT Agent的底层模型在多个基准测试中表现出色。在Humanity’s Last Exam测试中,ChatGPT Agent得分率达到41.6%,远超此前的记录。在FrontierMath测试中,当ChatGPT Agent可以访问工具时,其得分达到27.4%,是此前最佳成绩的四倍以上。在DSBench测试中,ChatGPT Agent在数据分析任务中的表现显著优于人类水平。在SpreadsheetBench平台上,ChatGPT Agent的性能也达到了行业领先水平,得分提升了超过一倍。
在实际应用场景中,用户可以在工作中利用ChatGPT Agent自动处理重复性任务,如将截图或面板转换为可编辑的演示文稿、重新安排会议、规划并预订外出活动,以及用新的财务数据更新电子表格。在个人生活中,用户可以使用它来规划并预订旅行行程、设计并预订整个晚宴活动,或寻找专业人士并安排预约。
在安全方面,OpenAI强调用户将始终掌握控制权,ChatGPT在执行重要操作前会先征得用户同意,用户可随时中断操作、接管浏览器或停止任务。用户还可以通过编辑器中的工具下拉菜单直接激活ChatGPT的新智能体功能,只需在任何对话的任何阶段选择“智能体模式”即可。用户只需描述希望完成的任务,无论是进行深入研究、制作幻灯片,还是提交费用报销,在执行任务时,屏幕上会实时展示ChatGPT的具体操作流程,用户可随时接管浏览器操作,确保任务始终与目标保持一致。
此外,用户可以设置已完成的任务自动重复执行,例如每周一早上自动生成周度指标报告。ChatGPT Agent即日起向Pro、Plus和Team版用户开放,Enterprise和Education版用户将于7月获得使用权限。Pro版用户每月可执行近乎无限的任务,其他付费用户每月可执行50次任务,额外使用量可通过灵活的积分额度选项获取。
OpenAI表示,ChatGPT Agent仍处于早期阶段,虽然能够处理多种复杂任务,但仍可能出现错误。尽管官方认为该功能在生成幻灯片方面具有巨大潜力,但目前该功能仍处于测试阶段,生成的内容在格式和细节处理上可能较为粗糙。OpenAI正在训练ChatGPT幻灯片创建功能的下一代版本,以生成更精致、更复杂的输出,并具备更广泛的功能和改进的格式化能力。OpenAI计划以定期的节奏逐步添加重大改进,使ChatGPT Agent随着时间的推移对更多人越来越有用。
(以上内容均由AI生成)