OpenAI 希望简化开发人员构建 AI 代理的方式
快速阅读: 《IT 专业人员》消息,OpenAI推出新工具简化具身AI开发,包括响应API、代理SDK等,支持搜索、观测等功能。新工具降低开发门槛,助力代理构建与优化。多家公司跟进,具身AI发展加速。
OpenAI发布了一系列旨在简化具身人工智能(具身AI)开发工作的工具和API。公司宣布了这一消息,表示尽管已经增加了新功能以支持具身工作流,但在生产环境中,客户在使用这些功能时仍面临提示迭代和定制化编排逻辑方面的挑战。
**新工具助力代理开发**
为了解决这些问题,OpenAI推出了“响应API”(Responses API)、“代理软件开发工具包”(Agents SDK)、新的搜索工具和新的集成可观测性工具。响应API与现有“聊天完成API”和“助手API”集成,用于协助代理构建;代理SDK则帮助用户编排单代理和多代理工作流。内置的搜索工具包含网络搜索和文件搜索功能,以及计算机使用功能,用户还可利用可观测性功能。OpenAI表示:“这些新工具从现实世界中获取信息,简化核心代理逻辑、编排和交互,使开发人员更容易开始构建代理。”
此外,OpenAI计划未来推出更多工具和功能,进一步简化并加速其平台上的具身开发。
**如何使用新工具?**
响应API旨在与搜索功能配合使用,从现实世界中获取信息,更高效地完成整个任务。它专注于第三方集成,面向希望将OpenAI技术及具身能力引入自己应用的开发者,而无需使用多个API或外部供应商。
通过网络搜索工具,API可以从互联网上获取最新的公开上下文,或者通过文件搜索工具获取内部专有业务上下文。网络搜索功能适用于创建购物助手、研究代理和旅行预订代理等场景,而文件搜索工具则可应用于客户服务和法律领域。网络搜索的价格为每千次查询30美元(GPT-4o搜索)和25美元(4o-mini搜索),文件搜索价格为每千次查询2.50美元,文件存储费用为每天每GB 0.10美元,首GB免费。
计算机使用功能可通过响应API创建能在计算机上执行功能的代理,如鼠标点击和键盘输入等。这一功能与OpenAI的“操作员”代理协同工作,其使用成本为每100万个输入令牌3美元,每100万个输出令牌12美元。
**管理与优化代理表现**
新的代理SDK为用户提供“交接”功能,可在代理间转移控制权,并具备安全性和验证检查的护栏功能。此外,代理SDK还带来跟踪和可观测性功能,帮助开发人员观察代理的表现和执行任务的方式,便于调试和优化。
**加入“DIY”代理趋势**
OpenAI是近期一系列公司中的最新一家,为用户提供构建代理和具身功能所需工具,延续了向“自己动手”代理开发趋势发展的市场潮流。本月早些时候,Databricks推出了新工具,帮助企业部署、监控和整合具身工具。同样,Workday也在其“代理记录系统”中采取类似措施。此外,AWS在其亚马逊贝德罗克(Amazon Bedrock)平台上加入了具身构建能力。
**结语**
随着OpenAI及其他公司的持续努力,具身人工智能正逐渐走向成熟。这些工具不仅降低了开发门槛,也为各行各业的应用打开了大门,未来的发展值得期待。
(以上内容均由Ai生成)