OpenAI发布ChatGPT Agent：能主动思考、购物、做PPT

发布时间：2025年7月18日来源：szf

快速阅读: 据相关媒体报道，OpenAI发布ChatGPT Agent，可自主执行任务，提升效率。支持网页浏览、代码执行等，性能优于竞品。安全机制完善，面向部分用户开放，未来或拓展更多功能。

据OpenAI官方博客报道，9月12日，美国旧金山，OpenAI正式发布了一款名为ChatGPT Agent的全新AI工具，这标志着人工智能技术从对话助手向自主任务执行者的重大转变。ChatGPT Agent集成了此前推出的Operator和Deep Research功能，能通过虚拟浏览器、终端和API访问，独立完成复杂任务，为用户节省时间并提高效率。

核心功能方面，ChatGPT Agent突破了传统的文本对话模式，能够像人类一样在线上进行浏览、点击、填写表单，甚至执行代码和调用API。它适用于多种任务场景，如根据预算和风格挑选婚礼服装、规划旅行路线、制作专业报表或创建演示文稿。OpenAI指出，该代理基于GPT-4模型驱动，融合了网页交互能力和深度研究功能，形成一个统一的智能系统。用户只需给出简单指令，Agent就能自主完成多步骤的任务，极大提升了工作效率。

在性能测试中，ChatGPT Agent表现出色。在“人类最后的考试”测试中，其准确率达到了41.6%，远高于之前的OpenAI o3模型的20.3%和Deep Research的26.6%。在投资银行建模任务中，Agent的平均准确率为71.3%，并且在Excel和PowerPoint相关任务上的表现也优于微软的Co pilot等竞品。此外，在网页导航任务BrowseComp和WebArena中的成绩分别为68.9%和65.4%，显示了其实用价值。

安全性和用户控制是ChatGPT Agent设计的重点。当遇到需要输入密码或进行支付等“高风险”操作时，Agent会请求用户明确授权，并支持用户随时暂停、中断或接管任务。为了防止恶意网站和提示注入攻击，OpenAI采取了严格的保护措施，比如限制敏感操作（如银行转账）和自动清除浏览记录。此外，Agent被归类为“高生物与化学”能力等级，启动了额外的安全机制。

目前，ChatGPT Agent已面向ChatGPT的Pro、Plus和Team用户开放。Pro用户每月可享有400次任务配额，而Plus和Team用户则为40次，超过限额可以购买额外的服务。OpenAI计划在未来几周内向企业及教育用户推广此功能，不过暂时不支持在欧盟和瑞士地区使用。OpenAI还透露，Agent可能是通往更高级别模型（如传闻中的GPT-5）的重要一步，未来可能会加入更多的功能，例如支付处理系统。

ChatGPT Agent的推出正值AI行业竞争激烈之时。微软的Co pilot、谷歌的Gemini以及xAI的Grok都在争夺数字生产力市场的主导权。通过推出Agent，OpenAI不仅巩固了其在生成式AI领域的领导地位，还对传统的搜索引擎和办公软件构成了挑战。业界分析人士认为，ChatGPT Agent可能改变人们与互联网和生产力工具的互动方式，成为AI驱动自动化的新标准。

AIbase评论称，ChatGPT Agent的发布是OpenAI从对话型AI迈向全面自动化的关键里程碑。尽管执行某些复杂任务可能耗时15至30分钟，但与人工操作相比，效率已显著提升。随着技术的不断进步和功能的拓展，ChatGPT Agent有望成为企业和个人用户的强大助手。然而，数据隐私和安全问题仍然值得关注。AIbase将继续关注该产品的最新进展，为读者提供深入的分析。

(以上内容均由AI生成)