OpenAI发布ChatGPT Agent:能主动思考、购物、做PPT
快速阅读: 据相关媒体报道,OpenAI发布ChatGPT Agent,可自主执行任务,提升效率。支持网页浏览、代码执行等,性能优于竞品。安全机制完善,面向部分用户开放,未来或拓展更多功能。
据OpenAI官方博客报道,9月12日,美国旧金山,OpenAI正式发布了一款名为ChatGPT Agent的全新AI工具,这标志着人工智能技术从对话助手向自主任务执行者的重大转变。ChatGPT Agent集成了此前推出的Operator和Deep Research功能,能通过虚拟浏览器、终端和API访问,独立完成复杂任务,为用户节省时间并提高效率。
核心功能方面,ChatGPT Agent突破了传统的文本对话模式,能够像人类一样在线上进行浏览、点击、填写表单,甚至执行代码和调用API。它适用于多种任务场景,如根据预算和风格挑选婚礼服装、规划旅行路线、制作专业报表或创建演示文稿。OpenAI指出,该代理基于GPT-4模型驱动,融合了网页交互能力和深度研究功能,形成一个统一的智能系统。用户只需给出简单指令,Agent就能自主完成多步骤的任务,极大提升了工作效率。
在性能测试中,ChatGPT Agent表现出色。在“人类最后的考试”测试中,其准确率达到了41.6%,远高于之前的OpenAI o3模型的20.3%和Deep Research的26.6%。在投资银行建模任务中,Agent的平均准确率为71.3%,并且在Excel和PowerPoint相关任务上的表现也优于微软的Co pilot等竞品。此外,在网页导航任务BrowseComp和WebArena中的成绩分别为68.9%和65.4%,显示了其实用价值。
安全性和用户控制是ChatGPT Agent设计的重点。当遇到需要输入密码或进行支付等“高风险”操作时,Agent会请求用户明确授权,并支持用户随时暂停、中断或接管任务。为了防止恶意网站和提示注入攻击,OpenAI采取了严格的保护措施,比如限制敏感操作(如银行转账)和自动清除浏览记录。此外,Agent被归类为“高生物与化学”能力等级,启动了额外的安全机制。
目前,ChatGPT Agent已面向ChatGPT的Pro、Plus和Team用户开放。Pro用户每月可享有400次任务配额,而Plus和Team用户则为40次,超过限额可以购买额外的服务。OpenAI计划在未来几周内向企业及教育用户推广此功能,不过暂时不支持在欧盟和瑞士地区使用。OpenAI还透露,Agent可能是通往更高级别模型(如传闻中的GPT-5)的重要一步,未来可能会加入更多的功能,例如支付处理系统。
ChatGPT Agent的推出正值AI行业竞争激烈之时。微软的Co pilot、谷歌的Gemini以及xAI的Grok都在争夺数字生产力市场的主导权。通过推出Agent,OpenAI不仅巩固了其在生成式AI领域的领导地位,还对传统的搜索引擎和办公软件构成了挑战。业界分析人士认为,ChatGPT Agent可能改变人们与互联网和生产力工具的互动方式,成为AI驱动自动化的新标准。
AIbase评论称,ChatGPT Agent的发布是OpenAI从对话型AI迈向全面自动化的关键里程碑。尽管执行某些复杂任务可能耗时15至30分钟,但与人工操作相比,效率已显著提升。随着技术的不断进步和功能的拓展,ChatGPT Agent有望成为企业和个人用户的强大助手。然而,数据隐私和安全问题仍然值得关注。AIbase将继续关注该产品的最新进展,为读者提供深入的分析。
(以上内容均由AI生成)