OpenAI 的战略策略:Agents SDK 以及为什么它改变了企业 AI 的一切
快速阅读: 据《VentureBeat 公司》称,开放人工智能推出综合性代理构建平台,整合响应API、内置工具及开源SDK,旨在解决企业AI开发碎片化问题。此举表明其战略转向,承认外部创新对提升代理可靠性的重要性,同时面临厂商锁定和全栈竞争挑战,预示AI代理生态竞争进入新阶段。
订阅我们的每日和每周简报,获取关于行业前沿人工智能的最新动态和独家内容。了解更多信息本周二,开放人工智能(OpenAI)发布了其综合性的代理构建平台,重塑了企业人工智能领域。该平台整合了升级版响应API、强大的内置工具以及开源的代理SDK。尽管这一消息可能被其他人工智能领域的热点新闻所掩盖——例如谷歌推出了令人印象深刻的开源Gemma 3模型,以及中国初创公司漫书(Manus)的自主代理平台令业界震撼——但对各大企业来说,这无疑是一个需要关注的重要举措。它将之前支离破碎的复杂API生态系统整合为一个统一且可投入生产的框架。对于企业人工智能团队而言,其潜在影响可能是深远的:以前需要多个框架、专门的向量数据库和复杂的协调逻辑的项目,现在可以通过单一的标准平台实现。但最值得注意的是,开放人工智能间接承认解决人工智能代理可靠性问题需要外部的专业知识。这一转变恰逢越来越多的证据显示外部开发者正在找到提升代理可靠性的创新方案。这一战略妥协标志着一个关键的转折点:开放人工智能认识到,即便拥有庞大的资源,通往真正可靠代理的道路也需要向外部开发人员开放,他们可以发现开放人工智能内部团队可能会忽略的创新解决方案和变通方法。对于企业人工智能团队而言,其潜在影响可能是深远的:以前需要多个框架、专门的向量数据库和复杂的协调逻辑的项目,现在可以通过单一的标准平台实现。但最值得注意的是,开放人工智能间接承认解决人工智能代理可靠性问题需要外部的专业知识。这一转变恰逢越来越多的证据显示外部开发者正在找到提升代理可靠性的创新方案。统一的代理开发方法本质上,这一公告代表了开放人工智能提供完整、可投入生产的人工智能代理构建堆栈的全面战略。此次发布将多个关键能力整合到一个统一的框架中:响应API基于聊天完成API,但增加了无缝集成工具使用的功能,并改进了创建代理的界面设计;内置工具包括网络搜索、文件搜索和计算机使用(即开放人工智能的运营商功能背后的技术);开源的代理SDK用于协调单代理和多代理工作流并支持交接。这一公告之所以意义重大,在于它解决了困扰企业人工智能开发的碎片化难题。决定采用开放人工智能API格式和开源SDK的企业将无需再拼凑不同框架,处理复杂的提示工程或应对不可靠的代理。“‘可靠’这个词非常重要,”独立开发人工智能代理的红龙(Red Dragon)联合创始人山姆·维特韦恩在最近一次关于此公告的视频播客深度访谈中对我说道,“我们多次提到……大多数代理都不可靠。因此开放人工智能在思考,‘我们该如何引入这种可靠性呢?’”在公告之后,支付公司Stripe的产品负责人杰夫·温斯坦在X上表示,Stripe已经展示了开放人工智能新代理SDK的实际应用,发布了一套工具包,使开发人员能够将Stripe的金融服务集成到代理工作流中。这种集成允许创建能够自动向承包商付款的AI代理,通过检查文件查看谁需要付款或不需要付款,以及处理账单和其他交易。对开放人工智能和市场的影响这一发布体现了开放人工智能战略的重大调整。在奠定基础模型优势之后,该公司通过一系列精心布局的举措巩固了其在代理生态系统中的地位:1. 开放外部创新开放人工智能承认,即便拥有丰富的资源,也无法超越社区创新的步伐。工具和开源SDK的推出表明了重要的战略妥协。发布的时机与漫书的出现相吻合,后者凭借非常有能力的自主代理平台给人工智能社区留下了深刻印象——利用Claude和Qwen现有的模型展示能力,基本上表明聪明的集成和提示工程可以实现可靠性,这是主要人工智能实验室都在努力解决的问题。“也许开放人工智能并不是制作运营商的最佳选择,”维特韦恩指出,他指的是开放人工智能在1月底推出的网页浏览工具,但我们发现它存在错误且不如竞争对手Proxy好。“也许这家中国初创公司在他们的提示中有一些不错的技巧,或者无论是什么,他们能够利用这些开源工具。”教训很清楚:开放人工智能需要社区的创新来提高可靠性。任何团队,无论多么优秀,无论是开放人工智能、Anthropic还是谷歌——他们都无法尝试开源社区所能尝试的东西。2. 通过API标准化确保企业市场开放人工智能的API格式已成为大型语言模型(LLM)接口的事实标准,得到了包括谷歌Gemini和Meta Llama在内的多家厂商的支持。开放人工智能调整其API具有重要意义,因为许多第三方厂商也会随之跟进并支持这些变化。通过控制API标准并使其更具扩展性,开放人工智能有望创造强大的网络效应。企业客户可以采用代理SDK,知道它可以与多种模型兼容,但开放人工智能依然处于生态系统的中心位置。开放人工智能的API格式已成为大型语言模型(LLM)接口的事实标准,得到了包括谷歌Gemini和Meta Llama在内的多家厂商的支持。开放人工智能调整其API具有重要意义,因为许多第三方厂商也会随之跟进并支持这些变化。3. 整合RAG管道文件搜索工具对Pinecone、Chroma、Weaviate等数据库公司构成了挑战。开放人工智能现提供完整的检索增强生成(RAG)工具。问题是,随着大量资金涌入的企业AI机会——如果能通过类似开放人工智能这样的单一标准获取大部分功能,那么这个长名单上的RAG供应商或其他代理协调供应商会发生什么?换句话说,企业可能会考虑将多个供应商关系整合至单一API提供商开放人工智能之中。公司可以上传任何希望与开放人工智能领先的基础模型配合使用的数据文档——并在API内搜索全部内容。尽管企业在某些方面可能受到与专用RAG数据库如Pinecone相比的限制,但开放人工智能内置的文件和网络搜索工具提供了明确的引用和URL——这对企业环境中强调透明度和验证的需求至关重要。文件搜索工具对Pinecone、Chroma、Weaviate等数据库公司构成了挑战。开放人工智能现提供完整的检索增强生成(RAG)工具。问题是,随着大量资金涌入的企业AI机会——如果能通过类似开放人工智能这样的单一标准获取大部分功能,那么这个长名单上的RAG供应商或其他代理协调供应商会发生什么?这种引用能力对企业环境中强调透明度和验证的需求至关重要——允许用户追踪信息的确切来源,并将其准确性与原始文档进行验证。企业决策的权衡对于企业决策者而言,这一公告既提供了简化AI代理开发的机会,但也需要谨慎评估潜在的厂商锁定风险及与现有系统的集成问题。1. 可靠性需求企业采用AI代理的速度因可靠性问题而受阻。例如,开放人工智能的计算机使用工具在WebVoyager基准的浏览器任务中达到了87%,但在OSWorld的操作系统任务中仅达38.1%。即便开放人工智能在其公告中也承认了这一局限性,并建议需要人工监督。然而,通过提供工具和可观测性功能来跟踪和调试代理性能,企业现在可以更自信地部署带有适当护栏的代理。2. 厂商锁定问题虽然采用开放人工智能的代理生态系统带来了即时优势,但也引发了关于厂商锁定的担忧。正如AgnoAGI创始人阿什普雷特·贝迪在公告后指出的:“响应API有意设计为通过更改base_url来防止开发者更换供应商。”然而,开放人工智能已做出重要让步,允许其代理SDK与来自其他供应商的模型配合工作。只要其他供应商提供的API端点符合聊天完成风格,SDK就支持外部模型。这种多模型方法为企业提供了一定的灵活性,但仍将开放人工智能置于核心位置。3. 全栈的竞争优势从工具到API再到SDK的全面发布,使开放人工智能相较于Anthropic或谷歌等竞争对手具有显著优势,后者采取了更为零散的代理开发方法。特别是在这一点上,谷歌表现欠佳。它尝试了多种不同的方式从现有的云服务中实现这一目标,但尚未达到能够上传PDF并使用谷歌Gemini进行RAG的程度。对代理生态系统的冲击这一公告极大地改变了构建代理相关企业的格局。像兰格链(LangChain)和克鲁伊AI(CrewAI)这样的公司,它们已经建立了代理开发框架,现在将直接面对开放人工智能代理SDK的竞争。与开放人工智能不同,这些公司缺乏一个庞大且不断增长的基础LLM业务来支撑它们的框架。这种趋势可能加速代理框架领域的整合,促使开发者倾向于开放人工智能的生产就绪解决方案。同时,开放人工智能通过开发者使用收费来获利,对于GPT-4o每次调用收费0.3美元,对于GPT-4o-mini每次调用收费0.25美元用于网络搜索,高上下文搜索的费用上升到每次0.5美元——使其定价更具竞争力。通过提供内置的协调能力,开放人工智能直接进入了专注于代理协调的平台的竞争领域。SDK对多代理工作流、交接、护栏和追踪的支持为企业需求创造了一个完整的解决方案。生产就绪是否即将到来?目前还很难判断新的解决方案效果如何。人们现在才开始在生产环境中使用代理SDK。尽管此次发布的涵盖面很广,但由于开放人工智能此前尝试过的代理框架(如实验性的Swarm和助手API)未能完全满足企业需求,因此仍存在疑问。对于开源版本,尚不清楚开放人工智能是否会接受外部人员的拉取请求和提交代码。助手API的弃用(计划于2026年中期)表明了开放人工智能对其新方法的信心。与不太受欢迎的助手API相比,新的响应API和代理SDK似乎基于开发者的反馈进行了更周到的设计。真正的战略转折点虽然开放人工智能长期以来一直处于基础模型开发的前沿,但这次公告标志着一次战略转折;该公司有可能成为代理开发和部署的中心平台。通过提供从工具到协调的完整堆栈,开放人工智能正在定位自己以捕捉在其模型之上创建的企业价值。同时,通过代理SDK的开源方法承认了即使开放人工智能也无法在孤立的情况下快速创新。虽然开放人工智能长期以来一直处于基础模型开发的前沿,但这次公告标志着一次战略转折;该公司有可能成为代理开发和部署的中心平台。AI战争进入了新的阶段。最初是一场建立最强大的基础模型的比赛,现在已经演变成一场争夺谁将控制代理生态系统之战——而通过这次全面发布,开放人工智能刚刚做出了迄今为止最具决定性的举动,使所有通往企业AI代理的道路都汇聚到其平台上。
观看这段视频,深入了解我和开发者山姆·维特韦恩关于开放人工智能发布对企业意味着什么的深入对话:
每日商业用例洞察VB每日
如果想给老板留下深刻印象,VB每日可以帮到你。我们为你提供公司如何使用生成式AI的内幕消息,从监管变化到实际部署,以便你可以分享见解以获得最大回报。立即订阅阅读我们的隐私政策感谢你的订阅。查看更多VB新闻通讯这里。这里发生错误。
(以上内容均由Ai生成)