GPT-5.1更新加速编码,大幅降低API成本

发布时间:2025年11月14日    来源:szf
GPT-5.1更新加速编码,大幅降低API成本

快速阅读: OpenAI发布GPT-5.1,通过自适应模式和无推理模式加速编程,降低API成本,提高IDE智能,增强编码效率和响应速度。

Elyse Betters Picaro/ZDNET

关注 ZDNET:

将我们设为 Google 的首选来源。

ZDNET 要点总结

GPT-5.1 通过自适应模式和无推理模式加速编程。

新的提示缓存功能降低了嵌入式应用程序开发者的 API 成本。

新工具使现代 IDE 中的 AI 代理更加智能。

OpenAI 推出了其前代大型语言模型 GPT-5 的新版本 GPT-5.1。GPT-5 于去年8月推出,在人工智能的发展速度下,这似乎已是很久以前的事了。OpenAI 当然在利用 AI 加速其编码过程。毕竟,它正与其他大公司竞争,以实现数万亿美元的估值。此外,实践证明,对于专业程序员而言,AI 编码几乎是神奇的力量倍增器和项目加速器。

(披露:ZDNET 的母公司 Ziff Davis 于2025年4月对 OpenAI 提起诉讼,指控其在训练和运营 AI 系统时侵犯了 Ziff Davis 的版权。)

此外:

OpenAI 的 GPT-5.1 让 ChatGPT 更温暖、更智能——其升级模式如何运作

关于 GPT-5.1 对消费者聊天机器人用户的益处,

请阅读高级编辑 Sabrina Ortiz 的解释

。但如果你对在编程或软件中使用 AI 感兴趣,请继续阅读。此次发布的更新带来了实际的速度提升和成本节省优势。

本文讨论的是

API 驱动下的 GPT-5.1

。换句话说,我们将探讨通过程序函数调用向 AI 发送提示,并接收调用返回的结果的过程。这种 API 驱动的 AI 功能不仅在开发者制作的软件产品中工作,而且由于开发工具本身也使用 API 提供智能支持,因此增加了这些工具的实用性。这同样有利于使用 OpenAI 的 Codex 编码代理的开发者,因为 Codex 现在也有 5.1 版本。

例如,JetBrains 是一款优秀开发工具的制造商。尽管我

已经从 JetBrains 平台转向 VS Code

,因为后者使用更为广泛(我经常需要与你讨论它),但我仍然非常喜欢 JetBrains 的产品。事实上,在使用 VS Code 时,有时我会怀念 JetBrains 的某些特性。

这就是为什么当 JetBrains 的 AI 开发工具生态系统负责人 Denis Shiryaev 在 OpenAI 博客文章中描述公司对新 GPT-5.1 版本的体验时,显得如此有趣。他说:“GPT 5.1 不仅仅是一个语言模型——它真正具有自主性,是我测试过的最自然自主的模型。”

“它的写作方式像你一样,编码方式像你一样,能够轻松遵循复杂的指令,并在前端任务中表现出色,完美融入现有的代码库。”他说道。

接下来,让我们看看 GPT-5.1 为何能获得如此热烈的反响。

自适应推理

我发现使用 GPT-5 编码非常强大,但偶尔会有些繁琐。无论我向 AI 提出什么问题,都需要时间来回应。即使是简单的询问,也可能需要几分钟才能得到回复。这是因为所有查询都发送到了同一个模型上。

GPT-5.1 会评估给定的提示,根据问题是简单还是复杂,调整其回答所需的认知努力。这意味着简单的问题不会再有之前使用旧编码模型时的延迟。

这里有一个我几天前给 GPT-5 的提示:“请检查我的工作。我正在重命名 EDD_SL_Plugin_Updater,以便每个使用它的插件都有一个独特的名称,以避免冲突。我已经更新了更新器文件中的类名,更新了更新器文件名,并更新了插件主文件中对该文件和类的引用。请检查插件是否有任何错误,并向我报告,不要做任何更改。”

相比之下,“显示已安装插件列表的 WP-CLI 命令是什么?”这样的问题就非常简单。这基本上是一个文档查找,几乎不需要任何智能。这只是为了节省时间,避免切换到浏览器进行 Google 搜索。

对于这类快速问题,答案更快,且使用的令牌更少。令牌是衡量处理量的单位。API 调用按令牌计费,这意味着简单的便利问题成本更低。

还有一个强大的方面,即 OpenAI 所谓的“更持久的深度推理”。没有什么比与 AI 长时间对话后,它突然忘记你在说什么更令人沮丧的了。现在,OpenAI 称 AI 可以更长时间地保持对话连贯。

“无推理”模式

这又是一个案例,表明OpenAI在产品命名方面可能需要一些坚实的产品管理。这种模式并没有关闭上下文理解、高质量代码编写或指令理解能力,而是关闭了深入的、链式思考风格的分析。他们应该将其称为“不要过度思考”模式。

可以这样想:我们都有一个朋友,对每个问题或行动都过度思考。这让他们陷入困境,花很长时间才能完成简单的事情,往往导致分析瘫痪。有时候需要深度思考,有时候则只需选择纸袋还是塑料袋,然后继续前进。

此外:

我将两种AI工具结合,解决了重大bug——但这离不开我的参与

新的无推理模式使AI能够避免其通常的逐步推理,直接跳到答案。这非常适合简单的查找或基本任务。这大大减少了响应时间(延迟),也使得编码体验更加响应迅速、快速和流畅。

将无推理模式与自适应推理相结合,意味着AI可以在回答复杂问题时花费时间,但在应对简单问题时能快速回应。

扩展提示缓存

另一个速度提升(伴随成本降低)是扩展提示缓存。当AI收到提示时,它首先需要使用自然语言处理能力来解析该提示,以确定被问的是什么。

这绝非易事。AI研究人员花了数十年时间才让AI达到能够理解自然语言以及其中的上下文和微妙含义的程度。

因此,当发出提示时,AI必须做一些实际的工作来将其标记化,创建内部表示,从而构建响应。这并不是没有资源利用成本的。

如果在一个会话中问题被重新提出,或者相同或类似的提示需要重新解释,这个成本就会再次产生。请注意,这里不仅指程序员给API的提示,还包括应用程序内部运行的提示,这些提示在应用程序使用过程中可能会频繁重复。

例如,客户支持代理的详细提示,在每次客户互动时都需要处理同一套基本起始规则。该提示可能需要数千个标记来解析,并且每天需要处理数千次。

通过缓存提示(OpenAI现在将其缓存24小时),提示只需编译一次,然后即可重用。这可能会带来显著的速度提升和成本节约。

更好的设计集成商业案例

所有这些改进为OpenAI提供了向客户展示更好设计集成的商业案例。设计集成是一个相当古老的术语,用于描述组件被设计到产品中。

最著名(也是最具影响力)的设计集成案例可能是1981年IBM选择Intel 8088 CPU用于最初的IBM PC。这一决定启动了整个x86生态系统,并推动了Intel在处理器领域的成功数十年。

如今,Nvidia因数据中心运营商对AI处理能力的巨大需求而受益匪浅。这种需求推动Nvidia成为按市值计算全球最有价值的公司,市值超过5万亿美元。

OpenAI也从设计集成中受益。CapCut是一款视频应用,2025年的下载量达3.61亿次。Temu是一款购物应用,2025年的下载量达4.38亿次。如果这两家公司中的任何一家将AI嵌入其应用中,并使用来自OpenAI的API调用,OpenAI将从累积的API调用量及其相关账单中获得大量收入。

然而,与物理组件一样,设计集成的成本也是一个问题。每减少几分之一美分的成本,都会增加最终产品的价格或严重影响利润率。

因此,归根结底,如果OpenAI能够大幅降低API调用的成本,同时仍能提供AI价值,正如GPT-5.1所显示的那样,那么它更有机会说服开发者在其产品中包含GPT-5.1。

更多新功能

GPT-5.1的发布还带来了更好的编码性能。AI更具可操控性和顺从性,这意味着它更能遵循指令。如果我的小狗也能更顺从些,邮件送达时就不会有持续的痛苦叫声了。

编码AI减少了不必要的过度思考,在调用工具时更加对话化,并在序列交互过程中表现出更加友好的行为。此外,还引入了新的apply_patch工具,有助于处理多步骤编码序列和代理行动,以及一个新的shell工具,该工具在生成命令行命令及根据响应评估和行动方面表现更佳。

另外:

OpenAI现已推出新的代理编码伙伴:GPT-5-Codex

我对这一新版本感到非常兴奋。既然我已经在使用GPT-5,现在能体验到GPT-5.1带来的更多响应性提升将是一件好事。

那么您呢?您是否尝试过在编码或开发流程中使用GPT-5或新的GPT-5.1模型?您是否看到了OpenAI承诺的速度或成本改进,还是仍在评估这些变化对您的项目有多重要?对于选择集成到工具或产品中的AI模型而言,自适应推理、无推理模式或提示缓存等功能的重要性如何?欢迎在评论区分享您的看法。

您可以在社交媒体上关注我的日常项目更新。请订阅

我的每周更新通讯

,并在Twitter/X上关注

@DavidGewirtz

,在Facebook上关注

Facebook.com/DavidGewirtz

,在Instagram上关注

Instagram.com/DavidGewirtz

,在Bluesky上关注

@DavidGewirtz.com

,以及在YouTube上关注

YouTube.com/DavidGewirtzTV

(以上内容均由Ai生成)

关键词: API成本GPT-5.1编码

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日