华为 Ascend AI 910D 处理器旨在与 Nvidia 的 Blackwell 和 Rubin GPU 竞争

发布时间：2025年4月30日来源：szf

快速阅读: 《Tom 的硬件指南》消息，路透社称，华为下一代昇腾910D AI处理器性能有望超英伟达H100。昇腾910D将通过集群方式与英伟达Blackwell和Rubin GPU竞争，首批样品预计5月底推出。昇腾910D可能由中芯国际生产，华为需克服性能和效率挑战以保持竞争力。

路透社报道，华为下一代海思昇腾910D人工智能处理器预计将在性能上超越英伟达的H100。这款新处理器在单芯片对比中，将比英伟达的Blackwell B200和Blackwell Ultra B300 GPU稍逊一筹，更不用提计划于明年推出的下一代Rubin GPU。然而，华为通过构建包含数百个处理器的集群方式，应能使昇腾910D与基于英伟达当前Blackwell和即将推出的Rubin GPU的集群相竞争。

华为正准备开始测试其最先进的AI处理器昇腾910D，目标是超越英伟达的H100，并在面对美国出口限制时提供国内替代方案。消息人士称，华为已联系了几家本地公司，评估新的昇腾910D芯片是否满足性能和部署需求。预计首批样品将在五月底前推出。

此外，华为计划最早下个月开始向中国客户大规模出货其双芯片昇腾910C AI处理器（以及可能基于这些芯片的完整系统）。这些处理器中的大多数据报道是由台积电为一家第三方公司生产的。目前尚不清楚昇腾910D是否会由中国本土的中芯国际生产，或者在美国政府限制华为获取尖端半导体生产能力近五年后，华为是否会再次找到规避美国制裁的方法。

对于华为来说，达到英伟达H100的性能水平并不容易。该公司最新的双芯片昇腾910C提供了大约780 BF16 TFLOPS的性能，而英伟达的H100可以提供大约2000 BF16 TFLOPS的性能。为了达到H100的性能水平，华为将不得不重新设计昇腾910D的内部架构，并可能增加计算芯片的数量。

为了在明年的AI行业中保持竞争力，华为必须实现与美国开发的AI集群相当的性能。今年，该公司推出了搭载384个昇腾910C处理器的CloudMatrix 384系统。据称，在某些工作负载上它可以击败英伟达的GB200 NVL72，但代价是由于每瓦性能显著降低而导致的功耗大幅增加。它还拥有比NVL72机架多五倍以上的“AI处理器”。这种互联能否良好扩展到所需的处理器数量仍有待观察。

在无法获得尖端工艺技术的情况下，华为在明年保持竞争力将变得更加困难。英伟达计划在2026年推出其代号为Rubin的人工智能和高性能计算（HPC）GPU。Rubin GPU预计将采用台积电的N3（或更先进的）制造工艺，并且应该会提供比当前一代Blackwell GPU更高的每瓦性能。Rubin GPU预计可提供约8300 TFLOPS的FP8训练性能，BF16可能是这个的一半——大约是B200的两倍。

华为的昇腾910D和下一代CloudMatrix系统（搭载384个这样的处理器）理论上可以在机架级别提供具有竞争力的AI性能。然而，昇腾910D和英伟达的Rubin GPU相比现有产品能提供哪些性能优势仍有待观察。此外，需要注意的是，英伟达在中国市场几乎无法销售其高性能的Rubin GPU，因此在这个市场上华为实际上不会有直接竞争对手。

无论性能还是效率如何，华为的昇腾910D处理器在未来几年内很可能成为中国AI训练工作的主力。鉴于AI的战略重要性，昇腾910D（或其他国产AI处理器）的功耗不会成为限制因素，因为部署的数量可以弥补效率不足。对中国而言，主要的限制因素将是其生产足够多处理器的能力——无论是在国内生产，还是通过代理公司在海外生产。

(以上内容均由Ai生成)