GPU寿命超预期,AI产业泡沫论再受质疑
快速阅读: 近期关于人工智能泡沫的警告引发市场关注,但对GPU快速贬值的担忧被过分夸大。分析师指出,GPU有效使用年限可达6年以上,远超市场预期,旧GPU通过合理使用仍具高贡献利润率。
近期,有关人工智能泡沫的严厉警告震撼了市场。尽管如此,至少有一种担忧被夸大了。早在三月,我就提到了一些人工智能公司,包括CoreWeave,面临贬值风险的问题。八月时,曾经成功做空安然公司的吉姆·查诺斯也表达了类似的担忧。
主要的担忧集中在GPU上,这些芯片是训练和运行人工智能模型所必需的。随着新GPU的推出,旧款GPU因过时和技术磨损而变得不那么值钱。云计算公司必须通过折旧来逐步减少这些资产的价值,以反映实际情况。折旧速度越快,对利润的影响越大。
投资者开始担心,GPU的有效使用年限可能只有一到两年,而云服务提供商通常将这些资产的折旧年限设定为五到六年。这种会计上的不匹配可能导致人工智能行业在未来几年遭遇严重的收益打击。这一观点现在几乎已成为华尔街的共识,也是认为我们正处于大规模人工智能泡沫的主要论据之一。然而,问题在于这一观点是错误的:即使英伟达每18个月或更短时间就推出新的GPU架构,GPU的老化速度也没有一些投资者担心的那么快。
伯恩斯坦的首席芯片分析师斯塔西·拉斯贡在周一的研究报告中写道:“GPU可以盈利运行约6年。”他和他的同事指出,大多数大型超规模企业的折旧会计处理是合理的。“运行GPU的人工智能数据中心运营成本相对市场价来说非常低,这使得延长旧GPU的使用时间具有很高的贡献利润率。”(贡献利润率是指扣除变动成本后的剩余收入,是评估产品盈利能力及作出商业决策的常用方法)。
“即使每一代GPU在性能价格比方面有显著改进,供应商仍能在五年以上的A100芯片上获得舒适的利润率,这也意味着5-6年的折旧寿命是合理的。”分析师们补充说,这里提到的是2020年推出的英伟达A100芯片。
七年到八年
要了解为什么这些GPU能保持这么长时间的价值,最好咨询那些在人工智能数据中心实际操作这些组件的人士。Lambda的人工智能云服务提供商战略业务发展高级总监马特·罗表示,GPU的有效使用寿命可延长至七到八年。虽然大多数公司出于会计目的仍然使用六年的折旧计划,但保修延期和重新部署策略正在延长它们的实际使用寿命。罗告诉伯恩斯坦,保修合同通常持续五年,如果GPU故障,会被更换为新的,从而延长整个GPU群的使用寿命。他还指出,亚马逊网络服务提供了非常早期的GPU型号,如K80、P100和V100,这些都远远超过了六年的使用寿命。
2022年发布的英伟达H100 GPU目前在Lambda的数据中心内运行良好。利用率超过85%,Lambda在过去12个月内没有降低这款GPU的按需公共云定价。罗说:“我们都认为七到八年是可能的。”
Crusoe的经验
本周,我与Crusoe的产品管理副总裁欧文·梅纳德进行了交谈。Crusoe正在得克萨斯州开发巨大的Stargate数据中心综合体。梅纳德曾帮助构建谷歌的Vertex AI云服务,因此他是真正的实践专家。
梅纳德描述了一种生命周期,在这个周期中,GPU从最先进的AI模型训练任务转移到需求较低的推理工作负载。创建新的最先进模型时,需要最新的英伟达GPU。然后,运行这些顶级模型的过程称为推理,这需要强大的GPU,但不必是最新的。
除此之外,还有成千上万种不同的、有价值的AI工作负载可以在较旧的GPU上很好地运行。梅纳德说:“因为有许多不同类型的模型可以解决许多不同的问题,所以有很多空间可以让GPU长期使用,只是从一种任务过渡到另一种。”这是行业中广泛接受的观点。
免费与付费
人工智能云服务公司在决定使用哪些GPU时会考虑用户的期望和预算。例如,梅纳德描述了一个提供免费层和付费版本的AI服务。“对于免费版本,你可能会选择一个可以在较旧、成本更低的硬件上运行的AI模型,性能较低。”他说。
这足以创建用户的初始体验。之后,一些客户可能会转向付费版本。那时,您可以利用更强大的AI模型,这些模型需要更新的GPU来提供卓越的用户体验。
“我们看到了许多这样的机会,”梅纳德说,“并非所有问题都需要用最先进的大型模型和最新的GPU来解决。”
开源+旧GPU
有些AI服务计算需求较低,可以在开源模型上运行,例如阿里巴巴的通义千问、DeepSeek或Meta的Llama。一个例子是语音转文字服务(比如我用来转录与梅纳德访谈的服务)。
较旧或能力较弱的模型可以在旧GPU上运行,同时仍能为客户提供有价值的人工智能服务。例如,《商业内幕》就为此类转录付费。
随着更多初创公司采用成本更低的开源模型,旧GPU的使用可能会更加广泛。“开源模型可能非常出色,能够提供更具成本竞争力的架构,”梅纳德说。
旧GPU更便宜
虽然旧GPU在产生相同智能时消耗更多能源,但这并不意味着投资者总是偏好新GPU——这会加剧旧GPU的贬值问题。
实际上,据梅纳德所说,情况并非如此。旧GPU购买成本更低,因此即使它们能耗更高,综合考虑所有成本后,旧GPU通常还是更经济的选择。
“对于给定的GPU,成本始终是首要因素,”他解释道,“所以我们选择旧款GPU,因为它们更便宜。”
什么是L40?
于是,我向梅纳德询问了Crusoe使用的旧GPU的一个例子。他描述了Crusoe建造的新模块化数据中心,这些中心由初创公司Redwood Materials回收的电动汽车电池供电。
“我可以将Nvidia的L40s放入这些数据中心,”梅纳德说,“由于整个部署设计以能源为核心,我将能够产生影响。”
我从未听说过L40s,不得不问他这是什么。
“那是一款旧GPU,”他笑着说。
在这里订阅BI的Tech Memo通讯。您也可以通过电子邮件abarr@businessinsider.com与我联系。
(以上内容均由Ai生成)