DeepSeek 报告称，尽管有免费的 AI 服务，但日利润为 545%

发布时间：2025年3月2日来源：szf

快速阅读: 据《印度分析杂志》最新报道，中国AI初创公司深寻报告称，其推理服务理论日利润率达545%，但实际收益远低于理论值。深寻-V3和R1模型运营成本高，收入潜力大，但公司强调定价策略侧重长期采用。深寻R1训练预算为600万美元，引发市场反应，英伟达股价受影响。深寻计划提前发布R2模型，以实现更优编码和多语言推理。

中国AI初创公司深寻公司报告称，尽管面临货币化挑战和折扣定价结构，其推理服务的理论日利润率仍达到545%。该公司在近期的GitHub帖子中分享了这些细节，概述了其深寻-V3和R1模型的运营成本和收入潜力。根据深寻R1的价格模式——每次缓存命中每百万输入令牌收费0.14美元，缓存未命中每百万收费0.55美元，输出令牌每百万收费2.19美元——理论上每日产生的收入为562,027美元。然而，该公司承认，实际收益远低于理论值，原因包括深寻-V3定价较低、网络和应用程序服务免费访问以及自动夜间折扣。“我们的定价策略侧重于提高可访问性并促进长期采用，而非追求短期收入最大化，”深寻公司表示。

据该公司称，深寻的推理服务运行在英伟达H800 GPU上，矩阵乘法和分发传输使用FP8格式，而核心MLA计算和组合传输则使用BF16。公司根据需求调整GPU的使用量，在高峰时段部署所有节点，夜间减少节点数量以分配资源用于研究和训练。GitHub帖子显示，从2025年2月27日到2月28日中午12点，深寻记录了峰值节点占用率为278个，平均有226.75个节点在运行。每个节点配备八个H800 GPU，每小时每个GPU的租赁成本约为2美元，因此总日支出为87,072美元。上述披露可能会影响美国股市。深寻最新推出的R1模型，据称其训练预算为600万美元，引发了市场的强烈反应。英伟达股价下跌17%，市值蒸发近6000亿美元，主要是因为市场对模型效率的担忧。然而，在最近的财报电话会议上，英伟达首席执行官黄仁勋表示，公司的推理需求正在加速增长，这得益于测试时间扩展和新推理模型的推出。“像OpenAI的Grok 3和深寻R1这样的推理模型在推理时进行扩展。推理模型可以消耗高达100倍的计算资源，”他说。“深寻R1激发了全球的热情。这是一个极好的创新。但更重要的是，它开源了一个世界级的推理AI模型，”黄仁勋说。

据最近的一份报告显示，深寻计划尽早发布其下一个推理模型——深寻R2。该公司最初计划在五月初发布，但现在考虑更早的时间表。据说该模型能够生成“更优的编码”，并能在多种语言中进行推理。

(以上内容均由Ai生成)