华为 Ascend AI 910D 处理器旨在与 Nvidia 的 Blackwell 和 Rubin GPU 竞争
快速阅读: 《Tom 的硬件指南》消息,路透社称,华为下一代昇腾910D AI处理器性能有望超英伟达H100。昇腾910D将通过集群方式与英伟达Blackwell和Rubin GPU竞争,首批样品预计5月底推出。昇腾910D可能由中芯国际生产,华为需克服性能和效率挑战以保持竞争力。
路透社报道,华为下一代海思昇腾910D人工智能处理器预计将在性能上超越英伟达的H100。这款新处理器在单芯片对比中,将比英伟达的Blackwell B200和Blackwell Ultra B300 GPU稍逊一筹,更不用提计划于明年推出的下一代Rubin GPU。然而,华为通过构建包含数百个处理器的集群方式,应能使昇腾910D与基于英伟达当前Blackwell和即将推出的Rubin GPU的集群相竞争。
华为正准备开始测试其最先进的AI处理器昇腾910D,目标是超越英伟达的H100,并在面对美国出口限制时提供国内替代方案。消息人士称,华为已联系了几家本地公司,评估新的昇腾910D芯片是否满足性能和部署需求。预计首批样品将在五月底前推出。
此外,华为计划最早下个月开始向中国客户大规模出货其双芯片昇腾910C AI处理器(以及可能基于这些芯片的完整系统)。这些处理器中的大多数据报道是由台积电为一家第三方公司生产的。目前尚不清楚昇腾910D是否会由中国本土的中芯国际生产,或者在美国政府限制华为获取尖端半导体生产能力近五年后,华为是否会再次找到规避美国制裁的方法。
对于华为来说,达到英伟达H100的性能水平并不容易。该公司最新的双芯片昇腾910C提供了大约780 BF16 TFLOPS的性能,而英伟达的H100可以提供大约2000 BF16 TFLOPS的性能。为了达到H100的性能水平,华为将不得不重新设计昇腾910D的内部架构,并可能增加计算芯片的数量。
为了在明年的AI行业中保持竞争力,华为必须实现与美国开发的AI集群相当的性能。今年,该公司推出了搭载384个昇腾910C处理器的CloudMatrix 384系统。据称,在某些工作负载上它可以击败英伟达的GB200 NVL72,但代价是由于每瓦性能显著降低而导致的功耗大幅增加。它还拥有比NVL72机架多五倍以上的“AI处理器”。这种互联能否良好扩展到所需的处理器数量仍有待观察。
在无法获得尖端工艺技术的情况下,华为在明年保持竞争力将变得更加困难。英伟达计划在2026年推出其代号为Rubin的人工智能和高性能计算(HPC)GPU。Rubin GPU预计将采用台积电的N3(或更先进的)制造工艺,并且应该会提供比当前一代Blackwell GPU更高的每瓦性能。Rubin GPU预计可提供约8300 TFLOPS的FP8训练性能,BF16可能是这个的一半——大约是B200的两倍。
华为的昇腾910D和下一代CloudMatrix系统(搭载384个这样的处理器)理论上可以在机架级别提供具有竞争力的AI性能。然而,昇腾910D和英伟达的Rubin GPU相比现有产品能提供哪些性能优势仍有待观察。此外,需要注意的是,英伟达在中国市场几乎无法销售其高性能的Rubin GPU,因此在这个市场上华为实际上不会有直接竞争对手。
无论性能还是效率如何,华为的昇腾910D处理器在未来几年内很可能成为中国AI训练工作的主力。鉴于AI的战略重要性,昇腾910D(或其他国产AI处理器)的功耗不会成为限制因素,因为部署的数量可以弥补效率不足。对中国而言,主要的限制因素将是其生产足够多处理器的能力——无论是在国内生产,还是通过代理公司在海外生产。
(以上内容均由Ai生成)