Nvidia 凭借 Doudna 超级计算机获得自 2022 年以来的首次 Doe 胜利

发布时间：2025年5月31日来源：szf

快速阅读: 据《The Register》最新报道，美国能源部新一代超级计算机由戴尔建造，英伟达的维拉-鲁宾加速器提供动力，旨在加速多种科学工作负载，连接实验设施，预计服务于11,000名研究人员。

美国能源部的下一代超级计算机将由戴尔科技公司建造，并由英伟达的下一代维拉-鲁宾加速器提供动力——这标志着与通常由克雷-AMD团队合作建造的机器形成了一种显著变化。这是自2022年文纳多系统以来，英伟达在能源部赢得的第一个项目。以诺贝尔奖得主詹妮弗·杜德纳的名字命名，她开创了CRISPR基因编辑技术，杜德纳系统计划于明年在加州劳伦斯伯克利国家实验室首次亮相。与它的前身珀尔穆特相比，该系统承诺在“科学产出”上提高10倍，同时仅消耗2到3倍的电力。初步看来，这意味着该系统应该能从5.8到8.7兆瓦的电力中实现790千万亿次双精度性能，使其成为有史以来最节能的超级计算机，遥遥领先于其他。然而，这可能不会成为现实。

尽管我们还不知道GPU巨头下一代维拉-鲁宾超级芯片的具体细节，甚至不知道杜德纳系统会配备多少台，但我们确实知道英伟达最新的布莱克威尔超算加速器转向支持针对AI工作负载的4位精度格式，从而牺牲了长期以来被认为是科学计算中的关键因素——双精度性能。搭载72个GPU的英伟达基于布莱克威尔超算加速器的GB300 NVL72仅产生100万亿次FP64向量性能。作为参考，劳伦斯利弗莫尔国家实验室的埃尔卡皮坦系统的单个AMD MI300A可提供61.3万亿次双精度TFLOPS。我们不能确定英伟达的鲁宾加速器是否会延续这一趋势，但我们怀疑这就是为什么英伟达声称“科学产出”增加了超过10倍，而不是性能。

话虽如此，杜德纳系统可能不需要大量的64位浮点运算来完成其任务。这是因为该机器被设想为一种瑞士军刀，能够运行各种跨越传统HPC和AI的工作负载，速度是关键优先事项。“杜德纳超级计算机旨在加速广泛的科学工作流程，”NERSC主任苏迪普·多桑杰在一份声明中说。“杜德纳将通过能源科学网络（ESnet）连接到能源部的实验和观测设施，使科学家能够从全国各地无缝地将数据流导入系统中，并进行近乎实时的分析。”

例如，研究人员计划使用来自圣地亚哥DIII-D国家聚变点火设施控制室的数据进行实时等离子体建模。为此，该系统将采用英伟达的量子-X InfiniBand网络，每个端口将提供高达800 Gb/s的带宽——比能源部目前最强大的超级计算机使用的Slingshot NIC快4倍。“我们曾经认为超级计算机只是角落里的被动参与者，”杜德纳首席架构师尼克·赖特补充道，“现在它已成为整个工作流程的一部分，连接实验装置、望远镜和探测器。”

该系统预计将服务于大约11,000名研究人员，涵盖聚变能源、材料科学、药物研发、天文学和蛋白质设计等多个领域。戴尔警告称，其140亿美元的人工智能服务器订单积压项目是非线性的。同济会加入共封装光模块竞赛并收购Enosemi。英伟达计划在上海建立研发实验室，参议员们对此提出异议。特朗普的贸易政策将使英伟达损失105亿美元的下半年GPU收入。

与埃尔卡皮坦类似，将人工智能应用于科学工作负载仍然是能源部的主要关注点。国家能源研究科学计算中心（NERSC）之前曾使用人工智能预测新型蛋白质结构、分析粒子加速器的质子数据以及模拟复杂的化学反应。这就是我们预计英伟达的维拉-鲁宾加速器真正的亮点所在。正如我们在今年春天的GTC上了解到的那样，每个双GPU包将提供50千万亿次FP4计算，并配备288GB高速HBM4内存。

除了人工智能，杜德纳还将通过英伟达的CUDA-Q支持量子计算算法的研究。开发工具平台可以用于在量子处理器上运行工作负载，或者在传统的CPU和GPU硬件上进行模拟。

(以上内容均由Ai生成)