大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

发布时间:2025年8月24日    来源:szf
大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

快速阅读: DeepSeek宣布9月6日起执行新价格表,API最低价格上涨50%,取消夜间优惠。2024年曾引发价格战,现行业整体价格趋于稳定,部分厂商上调价格,高端订阅方案价格超200美元/月。

8月21日,DeepSeek在其公众号宣布正式发布DeepSeek-V3.1,并从9月6日起执行新的价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整为12元/百万tokens。这一决定使使用DeepSeek API的最低价格较过去上涨了50%。

此前,DeepSeek在业内被称为“价格屠夫”。2024年5月,凭借DeepSeek-V2,DeepSeek将API价格降至输入1元/百万tokens、输出2元/百万tokens的行业低价,引发行业震动。当月,智谱、字节、阿里、百度、讯飞、腾讯等厂商纷纷跟进降价,最高降幅达80%-97%,部分厂商直接将轻量级模型免费开放,掀起了一场持续半年多的大模型价格战。

然而,2025年,越来越多的厂商选择停止降价。在国内,“大模型六小虎”中,智谱、月之暗面、MiniMax、阶跃星辰四家对部分API价格进行了上调,百川智能、零一万物两家保持价格不变;阿里、字节、腾讯、百度、科大讯飞、商汤等大厂普遍采用阶梯定价策略,或拉开“推理”与“非推理”模式的差距。行业整体API价格趋于稳定,部分产品出现明显上浮。

国际厂商虽然声称智能将越来越便宜,但实际情况是,过去一年OpenAI、Anthropic、谷歌等企业的API价格基本持平,甚至有小幅上涨。订阅方案越来越昂贵,顶级模型几乎被锁定在200美元/月及以上的高价档,xAI甚至推出了300美元/月的订阅方案。

在这一背景下,DeepSeek涨价只是更大规模行业趋势的一个缩影:当前,大模型价格的下行速度逐渐放缓,顶级AI服务不再无限下探,反而开始呈现趋于稳定,略有回升的态势。

以下是2025年部分厂商API价格变动情况:

1. DeepSeek、大模型六小虎API价格普涨,但有两家近1年未改价

大模型价格战曾是2024年国内AI圈最火的关键词之一,大模型API的价格一度降至每百万tokens几毛钱。然而,进入2025年后,这一降价趋势基本停滞,尤其是对于最先进的模型而言。

以DeepSeek为例,去年年底DeepSeek-V3发布时,DeepSeek进行了45天的限时优惠,结束后,DeepSeek-Chat API(非推理API)输出价格从2元恢复到8元;今年9月份,这一API的价格将进一步上调50%,至12元。DeepSeek-Reason API(推理API)的价格相对稳定,但将在9月份将输出价格从16元降至12元。总体来看,DeepSeek API的价格呈上涨趋势。

大模型六小虎中,智谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物的价格在2025年第一季度后基本没有明显下降。

2. 多家大厂细化定价规则,有模型输出超300字需加钱

更为“财大气粗”的大厂们在2025年也放缓了模型降价的步伐。

字节跳动2024年5月首次推出豆包Pro家族,小于32K上下文的豆包通用模型Pro输入价格仅为0.8元/百万tokens,输出价格为2元/百万tokens。字节跳动火山引擎总裁谭待在发布会上称,这一定价“比行业价格低99.3%”。此次发布将大模型价格战推向舆论的风口浪尖。

在32K上下文的场景下,2025年1月发布的豆包1.5 Pro与2025年7月的豆包1.6维持了豆包通用模型Pro的价格水平。不过,字节进一步细化了定价规则,当模型输出超过200个token(约300个汉字)时,豆包1.6的输出价变为8元/百万tokens,输入价不变。

阿里巴巴通过阿里云百炼对外提供大模型API服务,Qwen-Plus在2025年4月新版本推出后,引入思考与非思考模式的区别,思考型输出的价格是非思考输出的4倍。7月版本更新后,Qwen-Plus全面采用阶梯定价形式,128K输入以下的调用价格与4月份持平,但当输入量超过128K时,价格明显上涨,最高输出价格达到64元/百万tokens。

2024年7月,百度宣布将其旗舰模型ERNIE 4.0降价,以输入40元/百万tokens、输出120元/百万tokens的价格对外提供服务。随后,百度逐渐将ERNIE 4.0的推理价格降至业内常见的输入4元/百万tokens、输出16元/百万tokens,今年3月推出的ERNIE 4.5维持了这一定价,没有继续下降。

腾讯是国内少数仍在逐渐下调大模型API价格的企业。2024年9月,腾讯发布混元Turbo大模型,定价为输入15元/百万tokens、输出50元/百万tokens,在当时属于较高水平。目前,混元Turbo的价格已降至输入2.4元/百万tokens、输出9.6元/百万tokens,2025年3月发布的混元TurboS价格降至输入0.8元/百万tokens、输出2元/百万tokens。

科大讯飞的API服务按token包计费,不区分输入输出,不同套餐折合后的token单价不同。按照价格区间的中值计算,2024年1月推出的星火3.5价格约为25元/百万tokens,同年6月推出的星火4.0价格约为60元/百万tokens,同年10月发布的星火4.0 Turbo及2025年1月升级后的新版星火4.0 Turbo,都维持了这一价格。此外,讯飞还推出了一款基于全国产算力训练的深度推理大模型星火X1,价格约为11元/百万tokens。

商汤旗舰模型日日新系列的API价格从2024年5月的20元/百万tokens,回落至2025年4月的9元/百万tokens,今年7月最新发布的SenseNova-V6.5 Pro维持了这一价格。

3. 海外大模型厂商“说一套做一套”,订阅方案涨至200美元级别

国际主流大模型厂商之间虽未出现明显的价格战现象,但“鼓吹”智能成本将不断降低是海外AI圈几位大咖最热衷的话题之一。

今年7月,OpenAI联合创始人兼首席执行官Sam Altman表示:“智能的价格将低到无法计量,我们能将每个单位智能的成本每年降低至原来的1/10,至少持续5年。”2024年9月,谷歌首席执行官Sundar Pichai分享了同样的观点:“在不久的将来,智能将像空气一样丰富,基本对所有人免费。”

然而,近期The Information的统计数据揭示了一个与上述观点相悖的现实:海外主要大模型厂商的API价格在2024年7月后的1年多时间里没有明显下降,甚至有轻微的涨幅。例如,OpenAI的GPT系列模型每百万tokens的价格自2024年底降至12.5美元后,一直维持在11.25美元的水平。Anthropic的Claude 3、Claude 4系列模型自推出以来从未降价。谷歌的Gemini Pro模型调用价格从Gemini-1.5 Pro的12.5美元/百万tokens涨至17.5美元/百万tokens。

过去一年中,多家海外头部AI公司相继推出了月费超过200美元的高阶订阅方案。OpenAI与Anthropic均推出了200美元/月的订阅档位,谷歌最新的AI Ultra捆绑包定价为249.99美元/月,xAI旗下的Grok更进一步,将其顶级订阅方案设定为300美元/月。

高端订阅服务的特点在于,用户需支付高额月费,才能使用各大公司在发布会上展示的高性能旗舰模型。这些模型拥有更强的推理能力、更长的上下文窗口以及更精准的代码或复杂任务处理能力,但这些功能都位于付费墙之后,成为高付费用户的专享资源。

近期,AI服务价格下降趋势停滞,甚至出现上涨,其原因何在?在过去的一年里,大模型厂商在算力、数据及人才方面的巨大投入,推动了AI模型性能的快速提升。

在算力方面,GPU租赁价格已趋于稳定。据智东西收集的数据,2024年9月左右,AWS、微软Azure、谷歌云等主流公有云上的H100每卡时租赁价格约为5至11美元。今年,根据算力市场数据分析公司Silicon Data的GPU价格指数,H100的每卡时租赁价格已稳定在2至3美元之间,未出现大幅波动。

新一代大模型在训练和推理阶段的算力需求不断增加。尽管GPU价格相对稳定,算力成本仍是限制AI服务价格继续下降的重要因素之一。

数据成本同样不可忽视。起初,由于监管缺失,大模型训练数据的获取成本较低。但随着相关诉讼增多和合规审查趋严,厂商开始主动与企业签订合同,购买授权数据。例如,《华尔街日报》报道,OpenAI与美国出版集团News Corp签署了一份为期五年的数据使用协议,金额可能高达2.5亿美元;谷歌则与美国的贴吧类平台Reddit达成AI内容许可协议,路透社称其每年价格约为6000万美元。

同时,AI领域的人才成本也在上升。猎聘大数据研究院7月份发布的报告显示,当前国内AI人才缺口已超过500万,AI技术人员的平均年薪为32.35万元,其中50万元以上年薪的岗位占比达到31.03%,人才期望年薪更是高达44.09万元。

在美国,AI人才争夺战同样激烈。除了数亿美元的个别案例外,AI人才的整体薪资水平明显高于其他行业。国际职场平台Levels.FYI的数据显示,在旧金山湾区,ML/AI工程师的薪资中位数比所有软件工程师高出约13%。考虑到所有软件工程师的统计范畴内包含ML/AI工程师,后者的薪资优势可能更大。

随着大模型成本的不断攀升,用户用量也在增加。大模型订阅如同“无限流量卡”,用户使用越多,厂商提供的服务成本就越高。本月,Anthropic旗下的Claude Code编程Agent取消了200美元/月订阅方案的无限调用权限,原因是部分用户几乎全天候使用大模型,导致每月服务成本高达数万美元,远超订阅费用。

面对高昂的服务成本,大模型厂商纷纷采取措施降低成本。DeepSeek在其最新一代模型中引入了多种降本方法,如通过思维链压缩训练减少模型推理时的输出token数,同时保持任务表现与早期版本相当。此外,DeepSeek-V3.1还支持思考模式与非思考模式切换,进一步节省API使用成本。

腾讯混元通过架构创新降低成本。在混元TurboS上,腾讯融合了两种架构,使Transformer的上下文理解和Mamba的长序列处理能力相结合,实现了性能与效率的平衡。

OpenAI在GPT-5中采用“模型自动路由”方式,根据任务复杂度分配不同模型处理,从而节省算力资源。微软Azure表示,这一方式最高可将推理成本削减60%。

然而,关键在于,大模型厂商和云服务提供商的成本下降并不必然转化为终端用户和企业的使用成本下降。当前,如何将千亿美元级别的AI投资转化为商业价值,已成为所有大模型玩家面临的挑战。

未来,大模型价格的下降仍有几条路径。一方面,随着模型平均性能的提升,优化后的中低端廉价模型也能高效解决特定任务。另一方面,基础研究的进步和新技术的涌现,可能在不牺牲效果的前提下,进一步压缩训练与推理的单位成本。

从产业发展角度看,大模型价格的阶段性停滞或回升具有积极意义。这为厂商回收前期巨额投入、维持可持续创新提供了缓冲期,也有助于市场探索明确的商业化场景和付费模式,促进产业健康发展。

(以上内容均由Ai生成)

你可能还想读

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

快速阅读: Apriority宣布完成230万美元种子轮融资,由Techstars等领投。平台利用AI技术优化债务管理,帮助借款人节省利息,掌握财务控制权,尤其惠及低收入家庭。 旧金山,2025年10月23日 —— 以借款人为核心的服务平台 […]

发布时间:2025年10月23日
Cercli获1200万美元融资,加速AI劳动力平台发展

Cercli获1200万美元融资,加速AI劳动力平台发展

快速阅读: 阿联酋工作管理平台Cercli获1200万美元A轮融资,由Picus Capital领投。资金将用于产品开发、AI创新及市场扩展,目标中东、欧洲和北美。Cercli实现每月22%增长率,客户覆盖50国。 总部位于阿联酋的工作管理 […]

发布时间:2025年10月23日
扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

快速阅读: Meta宣布裁减AI部门约600名工程师,涉及FAIR等多个团队,旨在精简业务提高效率。CEO扎克伯格重申AI仍是公司核心,将继续投资高级机器学习和超级智能项目。 Meta近日宣布从其人工智能(AI)部门裁员约600名工程师,此 […]

发布时间:2025年10月23日
Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

快速阅读: 风险投资公司a16z计划筹集100亿美元,重点投资AI和国防,未提及加密货币。此举令人意外,因a16z曾是加密领域的重要支持者,近期仍积极投资相关项目。 据报道,风险投资公司安德森·霍洛维茨(a16z)正在寻求筹集约100亿美元 […]

发布时间:2025年10月23日
花旗资助香港390万港元,助力贫困青年掌握AI技能

花旗资助香港390万港元,助力贫困青年掌握AI技能

快速阅读: 花旗基金会向香港“改变年轻生命基金会”捐赠50万美元,支持为期两年的“求职挑战”项目,提升弱势青少年的人工智能技能和求职能力,增强其就业竞争力。 花旗基金会向香港“改变年轻生命基金会”拨款50万美元(约390万港元),用于为期两 […]

发布时间:2025年10月23日
AI成新界面,企业转型加速

AI成新界面,企业转型加速

快速阅读: 自动驾驶技术从微小升级到移除方向盘,彻底改变车辆设计和旅程体验,重塑汽车与环境的关系。AI发展类似,通过小步快跑实现重大转变,成为统一的用户界面,改善客户互动体验。 多年来,汽车自主驾驶功能的发展似乎只是一系列微小的升级,比如车 […]

发布时间:2025年10月23日
实博蒂克斯成立顾问委员会,推动AI技术发展

实博蒂克斯成立顾问委员会,推动AI技术发展

快速阅读: Realbotix成立顾问委员会,增强AI技术,调整董事会。成员包括谷歌萨利姆·哈桑及转任的安德鲁·德苏扎,目标推进AI与机器人技术发展。弗雷德·派退休,公司感谢其贡献。调整优化产品,强化全球市场地位。 Realbotix公司宣 […]

发布时间:2025年10月23日
OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

快速阅读: OpenAI宣布在美国扩展Stargate数据中心计划,包括威斯康星州Lighthouse项目,预计2028年完工,将开发近1吉瓦电力,采用可持续能源和环保措施,创造数千就业岗位。 该设施是OpenAI在披露美国五个Starga […]

发布时间:2025年10月23日