DeepSeek 报告称,尽管有免费的 AI 服务,但日利润为 545%
快速阅读: 据《印度分析杂志》最新报道,中国AI初创公司深寻报告称,其推理服务理论日利润率达545%,但实际收益远低于理论值。深寻-V3和R1模型运营成本高,收入潜力大,但公司强调定价策略侧重长期采用。深寻R1训练预算为600万美元,引发市场反应,英伟达股价受影响。深寻计划提前发布R2模型,以实现更优编码和多语言推理。
中国AI初创公司深寻公司报告称,尽管面临货币化挑战和折扣定价结构,其推理服务的理论日利润率仍达到545%。该公司在近期的GitHub帖子中分享了这些细节,概述了其深寻-V3和R1模型的运营成本和收入潜力。根据深寻R1的价格模式——每次缓存命中每百万输入令牌收费0.14美元,缓存未命中每百万收费0.55美元,输出令牌每百万收费2.19美元——理论上每日产生的收入为562,027美元。然而,该公司承认,实际收益远低于理论值,原因包括深寻-V3定价较低、网络和应用程序服务免费访问以及自动夜间折扣。“我们的定价策略侧重于提高可访问性并促进长期采用,而非追求短期收入最大化,”深寻公司表示。
据该公司称,深寻的推理服务运行在英伟达H800 GPU上,矩阵乘法和分发传输使用FP8格式,而核心MLA计算和组合传输则使用BF16。公司根据需求调整GPU的使用量,在高峰时段部署所有节点,夜间减少节点数量以分配资源用于研究和训练。GitHub帖子显示,从2025年2月27日到2月28日中午12点,深寻记录了峰值节点占用率为278个,平均有226.75个节点在运行。每个节点配备八个H800 GPU,每小时每个GPU的租赁成本约为2美元,因此总日支出为87,072美元。上述披露可能会影响美国股市。深寻最新推出的R1模型,据称其训练预算为600万美元,引发了市场的强烈反应。英伟达股价下跌17%,市值蒸发近6000亿美元,主要是因为市场对模型效率的担忧。然而,在最近的财报电话会议上,英伟达首席执行官黄仁勋表示,公司的推理需求正在加速增长,这得益于测试时间扩展和新推理模型的推出。“像OpenAI的Grok 3和深寻R1这样的推理模型在推理时进行扩展。推理模型可以消耗高达100倍的计算资源,”他说。“深寻R1激发了全球的热情。这是一个极好的创新。但更重要的是,它开源了一个世界级的推理AI模型,”黄仁勋说。
据最近的一份报告显示,深寻计划尽早发布其下一个推理模型——深寻R2。该公司最初计划在五月初发布,但现在考虑更早的时间表。据说该模型能够生成“更优的编码”,并能在多种语言中进行推理。
(以上内容均由Ai生成)