OpenAI 推出新的 API、SDK 和工具来开发自定义代理
快速阅读: 据《InfoQ 公司》称,OpenAI发布新响应API、智能体SDK及可观测性工具,助力生产级智能体开发。响应API整合聊天与助手功能,支持多种外部工具。智能体SDK用于管理智能体行为和控制转移。OpenAI计划逐步淘汰助手API,鼓励使用响应API。部分开发者担忧平台锁定风险,建议保留更多自主性。
OpenAI宣布推出新的**响应API**、**智能体软件开发工具包(SDK)**以及**可观测性工具**,以应对构建生产级智能体时所面临的挑战,例如自定义编排及复杂多步任务中的提示迭代。OpenAI表示,智能体很快将成为劳动力的重要组成部分,在各行各业中提升生产力,通过推理和多模态交互等高级能力完成复杂任务。这些新工具旨在让开发者更轻松地利用OpenAI平台构建具备自主性的工作流程。
**响应API**将聊天生成与助手功能相结合,并应在新项目中优先于**聊天生成API**和**助手API**。这一新API内置了对外部工具的支持,包括网络搜索、本地文件搜索以及通过鼠标和键盘控制计算机。此外,根据开发者的反馈,该API进行了多项改进,使其使用更加直观,包括统一的设计、简化多态性、优化流式传输以及多个SDK辅助功能。在网络搜索方面,响应API采用了与ChatGPT搜索、GPT-4o搜索预览和GPT-4o迷你搜索预览相同的模型。这些模型在SimpleQA基准测试中分别取得了90%和88%的准确率,显著优于“原生”GPT模型的表现(准确率在15%-63%之间)。然而,在OSWorld基准测试中,计算机使用工具仅达到了38.1%,这表明该模型在自动化操作系统任务方面尚未高度可靠。
尽管聊天生成API和助手API目前仍然会继续提供服务,并且OpenAI承诺通过新模型和功能增强前者,但公司已宣布助手API将在明年被弃用。
除了响应API,OpenAI还推出了新的**智能体SDK**,用于定义不同智能体、管理它们之间的控制转移(交接)、定义输入和输出的护栏以防止无关、有害或不期望的行为,并通过可视化跟踪来观察智能体行为。智能体SDK支持所有当前的OpenAI模型,包括o1、o3-mini、GPT-4.5、GPT-4o和GPT-4o-mini。它还允许开发者通过向量存储和嵌入API为智能体添加外部和持久的知识。依赖于响应API,智能体SDK支持相同的外部工具进行网络搜索、本地文件搜索或控制计算机。智能体SDK取代了其实验性的编排代理Swarm,并兼容任何聊天生成风格的API,包括响应API和第三方API。
在社区反应中,一些Hacker News(HN)读者认为OpenAI放弃聊天生成API可能是出于“非技术性”原因,并带来了对其平台的锁定风险。同样地,一些读者建议淘汰助手API意味着一个好的方法并不是重写代码以适应响应API,而是创建一个包装器,以便在需要时有机会更换底层大型语言模型(LLM)。另一方面,几位HN读者指出采用智能体SDK或其他代理中间件意味着你实际上是在将状态管理和业务逻辑外包给第三方,而你可能更倾向于尽量缩小LLM组件并在其周围构建自己的逻辑。
关于作者:塞尔吉奥·德·西莫内
(以上内容均由Ai生成)