中国芯片过剩的奇特案例
快速阅读: 据《福布斯》称,2024年,中国在人工智能芯片领域面临复杂局面:一方面,大量先进GPU闲置;另一方面,如深寻等公司仍面临计算能力短缺。这源于物流低效、需求错配及盲目囤积。政府已采取措施限制新建数据中心,并鼓励云计算共享资源。尽管目前存在产能过剩,长远看这仍是投资未来的重要步骤。
单位(GPU)战略性地定位在计算机主板上的单元。盖蒂2024年,中国在人工智能芯片领域经历了复杂的情况:某些领域出现产能过剩,同时在高性能计算方面面临短缺,这些高性能计算是开发先进人工智能所必需的。这种矛盾不仅仅是技术故障或地缘政治博弈的副产品——它是一个深深的人性故事,讲述了野心、随机应变以及淘金热心态带来的意外后果。让我们从一个画面开始:中国各地闲置的数据中心遍布全国,其中充满了世界上最先进的GPU,等待着一个用途。与此同时,最近取得突破并引起轰动的人工智能公司深寻声称其计算能力受限——缺乏构建下一代人工智能模型所需的算力。这两者怎么可能同时为真?
要理解这一点,我们需要回顾近期的历史。当美国对中国获取尖端人工智能芯片实施限制时,中国公司、地方政府和国有电信巨头的反应迅速且可预见:囤积。面对稀缺,他们像人类一直以来所做的那样囤积起来。他们购买了英伟达的芯片,建立了人工智能数据中心,并在预期未来需求的情况下创建了庞大的计算集群。与此同时,中国买家继续规避美国出口管制措施,通过附近地区的第三方订购英伟达最新发布的人工智能芯片,包括新的Blackwell系列。
但在他们急于为人工智能驱动的未来做准备的过程中,许多人未能提出一个基本问题:我们究竟要用这么多计算能力做什么?让我们从一个画面开始:中国各地闲置的数据中心遍布全国,其中充满了世界上最先进的GPU,等待着一个用途。与此同时,最近取得突破并引起轰动的人工智能公司深寻声称其计算能力受限——缺乏构建下一代人工智能模型所需的算力。这两者怎么可能同时为真?
低效问题
这种悖论的第一个解释在于物流。2024年,中国将其计算能力增加了至少100万个AI芯片。虽然这是一个显著的数字,但重要的是要注意,美国估计正在运行的AI芯片数量是数倍于此。然而,中国的芯片并不是以效率为导向部署的。相反,它们被分散到质量参差不齐的数据中心中,通常位于需求不足的地方。公司和政府急于参与人工智能热潮,在没有明确战略的情况下建设基础设施,导致了所谓的低效计算的过剩。想象一下,数百万人购买昂贵的钢琴,认为总有一天会学会演奏。但不是将它们放在音乐厅或音乐学院,而是散落在小型、维护不良的存储单元中。钢琴存在,但它们的潜力未得到实现。这实际上就是中国人工智能生态系统中发生的事情。
短期与长期需求问题
第二个解释在于时间点。2023年,有一股开发基础模型的热潮——这些巨大的人工智能系统支撑着从聊天机器人到自动化工厂的一切。但在2024年,许多这些努力停滞了。一些公司放弃了,意识到自己缺乏竞争所需的资金。另一些则转向人工智能应用而非基础人工智能研究。结果,对模型训练的需求——最耗计算资源的人工智能任务——下降了。与此同时,对推理的需求——在训练数据上运行人工智能模型的过程——开始上升。但推理需要不同类型的基础设施。训练是一场马拉松,需要庞大的集中式计算资源。推理更像是一场复杂的舞蹈,人工智能模型被部署在多个环境中,从智能手机到工厂车间。中国在2023年建设的基础设施是为训练设计的。2024年,市场发生了转变,留下了训练计算的过剩和推理计算的不足。
另一个复杂因素是“假”和“伪”10,000-GPU集群的现象。一些公司购买了足够多的GPU,理论上可以形成大型人工智能计算中心,但随后将它们部署在多个小型、孤立的数据中心中。如果没有高速网络和正确的软件架构,这些芯片无法作为一个真正的统一系统工作。这是一个典型的误把积累当成实力的例子。拥有数千个GPU并不自动转化为有竞争力的人工智能研究,就像买了一百辆顶级赛车一样不会让你成为一个世界级的赛车团队。中国的许多人工智能集群更多地作为财务资产存在,而不是作为功能性研究工具。
政府的调整措施
中国政府并没有忽视这些低效问题。作为回应,它已经开始限制新建数据中心,除非它们符合特定的位置和基础设施标准。它还鼓励云计算,推动公司共享计算能力,而不是囤积私有的GPU集群。理论上,这些举措应该有助于通过集中高质量计算资源来纠正不平衡,并使真正需要这些资源的人工智能研究人员能够使用它们。中国政府还限制了新建数据中心,除非它们符合特定的位置和基础设施标准,并鼓励云计算以提高资源利用率。中国政府并没有忽视这些低效问题。作为回应,它已经开始限制新建数据中心,除非它们符合特定的位置和基础设施标准。它还鼓励云计算,推动公司共享计算能力,而不是囤积私有的GPU集群。理论上,这些举措应该有助于通过集中高质量计算资源来纠正不平衡,并使真正需要这些资源的人工智能研究人员能够使用它们。
但这里有一个真正的问题:这一切在长期内真的重要吗?历史先例考虑19世纪美国铁路繁荣的例子。在工业化热潮中,公司到处铺设轨道,往往不顾实际需求。有些铁路变成了无用之物,只是投机的遗迹。然而,随着工业和城市的发展,其他铁路找到了自己的用途。随着时间的推移,最初的混乱让位于更高效的系统。同样的情况很可能会发生在中国的人工智能基础设施上。今天的产能过剩可能是明天突破的基础。尽管目前许多闲置的GPU都被浪费了,但它们代表了一项投资,预示着一个人工智能应用广泛普及的未来。那些适应变化的企业——整合计算资源,转向推理,优化部署策略——将会变得更强大。那些不能适应的将成为中国人工智能崛起历史中的注脚。
总结
虽然深寻的成就意义重大,但重要的是要注意,获得高级芯片仍然是长期人工智能发展的关键。正如一位专家所说:“如果下一代模型需要100,000个芯片进行训练,出口控制将严重影响中国前沿模型的发展。”人工智能领域的格局仍在快速变化,效率提升和获得高级硬件将在塑造全球人工智能发展的未来中发挥关键作用。
(以上内容均由Ai生成)