大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

发布时间:2025年8月24日    来源:szf
大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

快速阅读: DeepSeek宣布9月6日起执行新价格表,API最低价格上涨50%,取消夜间优惠。2024年曾引发价格战,现行业整体价格趋于稳定,部分厂商上调价格,高端订阅方案价格超200美元/月。

8月21日,DeepSeek在其公众号宣布正式发布DeepSeek-V3.1,并从9月6日起执行新的价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整为12元/百万tokens。这一决定使使用DeepSeek API的最低价格较过去上涨了50%。

此前,DeepSeek在业内被称为“价格屠夫”。2024年5月,凭借DeepSeek-V2,DeepSeek将API价格降至输入1元/百万tokens、输出2元/百万tokens的行业低价,引发行业震动。当月,智谱、字节、阿里、百度、讯飞、腾讯等厂商纷纷跟进降价,最高降幅达80%-97%,部分厂商直接将轻量级模型免费开放,掀起了一场持续半年多的大模型价格战。

然而,2025年,越来越多的厂商选择停止降价。在国内,“大模型六小虎”中,智谱、月之暗面、MiniMax、阶跃星辰四家对部分API价格进行了上调,百川智能、零一万物两家保持价格不变;阿里、字节、腾讯、百度、科大讯飞、商汤等大厂普遍采用阶梯定价策略,或拉开“推理”与“非推理”模式的差距。行业整体API价格趋于稳定,部分产品出现明显上浮。

国际厂商虽然声称智能将越来越便宜,但实际情况是,过去一年OpenAI、Anthropic、谷歌等企业的API价格基本持平,甚至有小幅上涨。订阅方案越来越昂贵,顶级模型几乎被锁定在200美元/月及以上的高价档,xAI甚至推出了300美元/月的订阅方案。

在这一背景下,DeepSeek涨价只是更大规模行业趋势的一个缩影:当前,大模型价格的下行速度逐渐放缓,顶级AI服务不再无限下探,反而开始呈现趋于稳定,略有回升的态势。

以下是2025年部分厂商API价格变动情况:

1. DeepSeek、大模型六小虎API价格普涨,但有两家近1年未改价

大模型价格战曾是2024年国内AI圈最火的关键词之一,大模型API的价格一度降至每百万tokens几毛钱。然而,进入2025年后,这一降价趋势基本停滞,尤其是对于最先进的模型而言。

以DeepSeek为例,去年年底DeepSeek-V3发布时,DeepSeek进行了45天的限时优惠,结束后,DeepSeek-Chat API(非推理API)输出价格从2元恢复到8元;今年9月份,这一API的价格将进一步上调50%,至12元。DeepSeek-Reason API(推理API)的价格相对稳定,但将在9月份将输出价格从16元降至12元。总体来看,DeepSeek API的价格呈上涨趋势。

大模型六小虎中,智谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物的价格在2025年第一季度后基本没有明显下降。

2. 多家大厂细化定价规则,有模型输出超300字需加钱

更为“财大气粗”的大厂们在2025年也放缓了模型降价的步伐。

字节跳动2024年5月首次推出豆包Pro家族,小于32K上下文的豆包通用模型Pro输入价格仅为0.8元/百万tokens,输出价格为2元/百万tokens。字节跳动火山引擎总裁谭待在发布会上称,这一定价“比行业价格低99.3%”。此次发布将大模型价格战推向舆论的风口浪尖。

在32K上下文的场景下,2025年1月发布的豆包1.5 Pro与2025年7月的豆包1.6维持了豆包通用模型Pro的价格水平。不过,字节进一步细化了定价规则,当模型输出超过200个token(约300个汉字)时,豆包1.6的输出价变为8元/百万tokens,输入价不变。

阿里巴巴通过阿里云百炼对外提供大模型API服务,Qwen-Plus在2025年4月新版本推出后,引入思考与非思考模式的区别,思考型输出的价格是非思考输出的4倍。7月版本更新后,Qwen-Plus全面采用阶梯定价形式,128K输入以下的调用价格与4月份持平,但当输入量超过128K时,价格明显上涨,最高输出价格达到64元/百万tokens。

2024年7月,百度宣布将其旗舰模型ERNIE 4.0降价,以输入40元/百万tokens、输出120元/百万tokens的价格对外提供服务。随后,百度逐渐将ERNIE 4.0的推理价格降至业内常见的输入4元/百万tokens、输出16元/百万tokens,今年3月推出的ERNIE 4.5维持了这一定价,没有继续下降。

腾讯是国内少数仍在逐渐下调大模型API价格的企业。2024年9月,腾讯发布混元Turbo大模型,定价为输入15元/百万tokens、输出50元/百万tokens,在当时属于较高水平。目前,混元Turbo的价格已降至输入2.4元/百万tokens、输出9.6元/百万tokens,2025年3月发布的混元TurboS价格降至输入0.8元/百万tokens、输出2元/百万tokens。

科大讯飞的API服务按token包计费,不区分输入输出,不同套餐折合后的token单价不同。按照价格区间的中值计算,2024年1月推出的星火3.5价格约为25元/百万tokens,同年6月推出的星火4.0价格约为60元/百万tokens,同年10月发布的星火4.0 Turbo及2025年1月升级后的新版星火4.0 Turbo,都维持了这一价格。此外,讯飞还推出了一款基于全国产算力训练的深度推理大模型星火X1,价格约为11元/百万tokens。

商汤旗舰模型日日新系列的API价格从2024年5月的20元/百万tokens,回落至2025年4月的9元/百万tokens,今年7月最新发布的SenseNova-V6.5 Pro维持了这一价格。

3. 海外大模型厂商“说一套做一套”,订阅方案涨至200美元级别

国际主流大模型厂商之间虽未出现明显的价格战现象,但“鼓吹”智能成本将不断降低是海外AI圈几位大咖最热衷的话题之一。

今年7月,OpenAI联合创始人兼首席执行官Sam Altman表示:“智能的价格将低到无法计量,我们能将每个单位智能的成本每年降低至原来的1/10,至少持续5年。”2024年9月,谷歌首席执行官Sundar Pichai分享了同样的观点:“在不久的将来,智能将像空气一样丰富,基本对所有人免费。”

然而,近期The Information的统计数据揭示了一个与上述观点相悖的现实:海外主要大模型厂商的API价格在2024年7月后的1年多时间里没有明显下降,甚至有轻微的涨幅。例如,OpenAI的GPT系列模型每百万tokens的价格自2024年底降至12.5美元后,一直维持在11.25美元的水平。Anthropic的Claude 3、Claude 4系列模型自推出以来从未降价。谷歌的Gemini Pro模型调用价格从Gemini-1.5 Pro的12.5美元/百万tokens涨至17.5美元/百万tokens。

过去一年中,多家海外头部AI公司相继推出了月费超过200美元的高阶订阅方案。OpenAI与Anthropic均推出了200美元/月的订阅档位,谷歌最新的AI Ultra捆绑包定价为249.99美元/月,xAI旗下的Grok更进一步,将其顶级订阅方案设定为300美元/月。

高端订阅服务的特点在于,用户需支付高额月费,才能使用各大公司在发布会上展示的高性能旗舰模型。这些模型拥有更强的推理能力、更长的上下文窗口以及更精准的代码或复杂任务处理能力,但这些功能都位于付费墙之后,成为高付费用户的专享资源。

近期,AI服务价格下降趋势停滞,甚至出现上涨,其原因何在?在过去的一年里,大模型厂商在算力、数据及人才方面的巨大投入,推动了AI模型性能的快速提升。

在算力方面,GPU租赁价格已趋于稳定。据智东西收集的数据,2024年9月左右,AWS、微软Azure、谷歌云等主流公有云上的H100每卡时租赁价格约为5至11美元。今年,根据算力市场数据分析公司Silicon Data的GPU价格指数,H100的每卡时租赁价格已稳定在2至3美元之间,未出现大幅波动。

新一代大模型在训练和推理阶段的算力需求不断增加。尽管GPU价格相对稳定,算力成本仍是限制AI服务价格继续下降的重要因素之一。

数据成本同样不可忽视。起初,由于监管缺失,大模型训练数据的获取成本较低。但随着相关诉讼增多和合规审查趋严,厂商开始主动与企业签订合同,购买授权数据。例如,《华尔街日报》报道,OpenAI与美国出版集团News Corp签署了一份为期五年的数据使用协议,金额可能高达2.5亿美元;谷歌则与美国的贴吧类平台Reddit达成AI内容许可协议,路透社称其每年价格约为6000万美元。

同时,AI领域的人才成本也在上升。猎聘大数据研究院7月份发布的报告显示,当前国内AI人才缺口已超过500万,AI技术人员的平均年薪为32.35万元,其中50万元以上年薪的岗位占比达到31.03%,人才期望年薪更是高达44.09万元。

在美国,AI人才争夺战同样激烈。除了数亿美元的个别案例外,AI人才的整体薪资水平明显高于其他行业。国际职场平台Levels.FYI的数据显示,在旧金山湾区,ML/AI工程师的薪资中位数比所有软件工程师高出约13%。考虑到所有软件工程师的统计范畴内包含ML/AI工程师,后者的薪资优势可能更大。

随着大模型成本的不断攀升,用户用量也在增加。大模型订阅如同“无限流量卡”,用户使用越多,厂商提供的服务成本就越高。本月,Anthropic旗下的Claude Code编程Agent取消了200美元/月订阅方案的无限调用权限,原因是部分用户几乎全天候使用大模型,导致每月服务成本高达数万美元,远超订阅费用。

面对高昂的服务成本,大模型厂商纷纷采取措施降低成本。DeepSeek在其最新一代模型中引入了多种降本方法,如通过思维链压缩训练减少模型推理时的输出token数,同时保持任务表现与早期版本相当。此外,DeepSeek-V3.1还支持思考模式与非思考模式切换,进一步节省API使用成本。

腾讯混元通过架构创新降低成本。在混元TurboS上,腾讯融合了两种架构,使Transformer的上下文理解和Mamba的长序列处理能力相结合,实现了性能与效率的平衡。

OpenAI在GPT-5中采用“模型自动路由”方式,根据任务复杂度分配不同模型处理,从而节省算力资源。微软Azure表示,这一方式最高可将推理成本削减60%。

然而,关键在于,大模型厂商和云服务提供商的成本下降并不必然转化为终端用户和企业的使用成本下降。当前,如何将千亿美元级别的AI投资转化为商业价值,已成为所有大模型玩家面临的挑战。

未来,大模型价格的下降仍有几条路径。一方面,随着模型平均性能的提升,优化后的中低端廉价模型也能高效解决特定任务。另一方面,基础研究的进步和新技术的涌现,可能在不牺牲效果的前提下,进一步压缩训练与推理的单位成本。

从产业发展角度看,大模型价格的阶段性停滞或回升具有积极意义。这为厂商回收前期巨额投入、维持可持续创新提供了缓冲期,也有助于市场探索明确的商业化场景和付费模式,促进产业健康发展。

(以上内容均由Ai生成)

你可能还想读

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

快速阅读: 欧洲广播联盟和BBC报告显示,AI平台传播新闻存严重风险,影响新闻生态,Perplexity和谷歌AI加剧公众信任下降,研究发现来源、准确性和背景问题是主要障碍。 欧洲广播联盟和BBC发布的一份新报告显示,使用生成式人工智能平台 […]

发布时间:2025年10月23日
AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

快速阅读: 特朗普退让提振市场情绪,但股市上涨主因是AI热潮。自2022年11月ChatGPT推出以来,美国标普500指数市值增加21万亿美元。 特朗普倾向于退让提振了市场情绪,但推动股市上涨的主要动力是围绕生成式人工智能(AI)的炒作。在 […]

发布时间:2025年10月23日
北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

快速阅读: 挪威Riff完成1600万美元A轮融资,累计2100万美元,由Northzone领投。Riff提供AI应用开发平台,支持多行业,旨在提升商业效果和项目成功率,新资金将用于市场扩展。 总部位于奥斯陆的Riff(原名Databutt […]

发布时间:2025年10月23日
Meta裁减AI部门约600岗位,加速技术竞赛

Meta裁减AI部门约600岗位,加速技术竞赛

快速阅读: Meta Platforms 从超级智能实验室裁减约600个职位,以加速AI技术发展。AI首席Alexandr Wang通知裁员,旨在加快决策,增加员工责任。Meta继续为TBD实验室招聘,该团队聚集高薪AI人才。 据报道,Me […]

发布时间:2025年10月23日
渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

快速阅读: Gartner预测,至2026年80%企业将部署生成式AI,但安全与数据基础设施挑战成障碍。研究显示,近半数企业因安全顾虑暂缓云迁移,超半数数据无备份,70%企业过去一年遭遇网络攻击,平均损失五周生产力。VARs在协助企业克服安 […]

发布时间:2025年10月23日
英政府推出AI工具,大幅提高咨询反馈分析效率

英政府推出AI工具,大幅提高咨询反馈分析效率

快速阅读: 英国政府宣布加速人工智能发展,采用“汉弗莱”系列中的Consult工具,每年可节省75,000个人工工作日,该工具处理50,000份咨询回复仅需2小时,效率远超人工。 英国政府宣布,将加速推进人工智能的发展。此前一项研究发现,每 […]

发布时间:2025年10月23日
IBM新Z17主机助力营收大增,AI成增长引擎

IBM新Z17主机助力营收大增,AI成增长引擎

快速阅读: IBM在生成式AI领域赢得95亿美元订单,大型机收入同比增长59%,新Z17机器贡献显著。AI基础设施增长15%,存储成为关键销售点。 克里希纳指出,IBM在生成式AI领域赢得了95亿美元的订单,这是一个显著的成绩。此外,IBM […]

发布时间:2025年10月23日
英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

快速阅读: 特朗普政府正与多家量子计算公司谈判,拟通过联邦资金注资换取股权,涉及IonQ、Rigetti Computing等,每家获至少1000万美元。 感谢IT之家网友 小兴365 的线索投递! IT之家 10 月 23 日消息,据《华 […]

发布时间:2025年10月23日