Nvidia 凭借 Doudna 超级计算机获得自 2022 年以来的首次 Doe 胜利
快速阅读: 据《The Register》最新报道,美国能源部新一代超级计算机由戴尔建造,英伟达的维拉-鲁宾加速器提供动力,旨在加速多种科学工作负载,连接实验设施,预计服务于11,000名研究人员。
美国能源部的下一代超级计算机将由戴尔科技公司建造,并由英伟达的下一代维拉-鲁宾加速器提供动力——这标志着与通常由克雷-AMD团队合作建造的机器形成了一种显著变化。这是自2022年文纳多系统以来,英伟达在能源部赢得的第一个项目。以诺贝尔奖得主詹妮弗·杜德纳的名字命名,她开创了CRISPR基因编辑技术,杜德纳系统计划于明年在加州劳伦斯伯克利国家实验室首次亮相。与它的前身珀尔穆特相比,该系统承诺在“科学产出”上提高10倍,同时仅消耗2到3倍的电力。初步看来,这意味着该系统应该能从5.8到8.7兆瓦的电力中实现790千万亿次双精度性能,使其成为有史以来最节能的超级计算机,遥遥领先于其他。然而,这可能不会成为现实。
尽管我们还不知道GPU巨头下一代维拉-鲁宾超级芯片的具体细节,甚至不知道杜德纳系统会配备多少台,但我们确实知道英伟达最新的布莱克威尔超算加速器转向支持针对AI工作负载的4位精度格式,从而牺牲了长期以来被认为是科学计算中的关键因素——双精度性能。搭载72个GPU的英伟达基于布莱克威尔超算加速器的GB300 NVL72仅产生100万亿次FP64向量性能。作为参考,劳伦斯利弗莫尔国家实验室的埃尔卡皮坦系统的单个AMD MI300A可提供61.3万亿次双精度TFLOPS。我们不能确定英伟达的鲁宾加速器是否会延续这一趋势,但我们怀疑这就是为什么英伟达声称“科学产出”增加了超过10倍,而不是性能。
话虽如此,杜德纳系统可能不需要大量的64位浮点运算来完成其任务。这是因为该机器被设想为一种瑞士军刀,能够运行各种跨越传统HPC和AI的工作负载,速度是关键优先事项。“杜德纳超级计算机旨在加速广泛的科学工作流程,”NERSC主任苏迪普·多桑杰在一份声明中说。“杜德纳将通过能源科学网络(ESnet)连接到能源部的实验和观测设施,使科学家能够从全国各地无缝地将数据流导入系统中,并进行近乎实时的分析。”
例如,研究人员计划使用来自圣地亚哥DIII-D国家聚变点火设施控制室的数据进行实时等离子体建模。为此,该系统将采用英伟达的量子-X InfiniBand网络,每个端口将提供高达800 Gb/s的带宽——比能源部目前最强大的超级计算机使用的Slingshot NIC快4倍。“我们曾经认为超级计算机只是角落里的被动参与者,”杜德纳首席架构师尼克·赖特补充道,“现在它已成为整个工作流程的一部分,连接实验装置、望远镜和探测器。”
该系统预计将服务于大约11,000名研究人员,涵盖聚变能源、材料科学、药物研发、天文学和蛋白质设计等多个领域。戴尔警告称,其140亿美元的人工智能服务器订单积压项目是非线性的。同济会加入共封装光模块竞赛并收购Enosemi。英伟达计划在上海建立研发实验室,参议员们对此提出异议。特朗普的贸易政策将使英伟达损失105亿美元的下半年GPU收入。
与埃尔卡皮坦类似,将人工智能应用于科学工作负载仍然是能源部的主要关注点。国家能源研究科学计算中心(NERSC)之前曾使用人工智能预测新型蛋白质结构、分析粒子加速器的质子数据以及模拟复杂的化学反应。这就是我们预计英伟达的维拉-鲁宾加速器真正的亮点所在。正如我们在今年春天的GTC上了解到的那样,每个双GPU包将提供50千万亿次FP4计算,并配备288GB高速HBM4内存。
除了人工智能,杜德纳还将通过英伟达的CUDA-Q支持量子计算算法的研究。开发工具平台可以用于在量子处理器上运行工作负载,或者在传统的CPU和GPU硬件上进行模拟。
(以上内容均由Ai生成)