英伟达宣布新一代超级计算机与开放AI模型,助力科学计算
快速阅读: 英伟达宣布与理化学研究所合作开发两款新型超级计算机,配备Blackwell GPU,用于传统超级计算、AI及量子计算,支持FugakuNEXT开发。同时,英伟达推出Apollo AI模型系列,提升工业模拟效率,与多家机构合作,推进数据中心基础设施建设。
英伟达宣布了一系列超级计算和人工智能工厂的相关消息,其中包括新硬件的采用和高性能计算(HPC)计划,这些计划得到了合作伙伴组织的支持。此次宣布的时间恰逢超级计算2025(SC25)开幕,这是一年一度在圣路易斯举行的HPC活动。英伟达发布了多个HPC和超级计算机站点的新订单,并签署了一系列协议,允许主要合作伙伴使用其网络交换机。
首先,英伟达宣布将与日本公共研究机构理化学研究所(Riken)合作,开发两款由GB200系统驱动的新型超级计算机。第一台超级计算机将结合传统超级计算和人工智能技术,解决制造、机器人、地震学和量子研究等领域的问题。该系统将配备1600个英伟达Blackwell GPU,通过Quantum-X800 InfiniBand网络连接,并基于GB200 NVL4平台构建。
第二台超级计算机旨在将GPU与理化学研究所的量子HPC混合基础设施相结合。该系统将配备540个Blackwell GPU,采用相同的计算平台和网络技术,目标是运行量子算法和混合计算模拟。
“将英伟达GB200 NVL4加速计算平台集成到我们的下一代超级计算机中,对于日本的科研基础设施来说是一个重要的进步。”理化学研究所计算科学中心的主任松冈悟志表示,“我们的合作将创建出世界上领先的统一平台,涵盖人工智能、量子和高性能计算领域,助力研究人员在基础科学到工业应用等多个领域加速发现。”
理化学研究所的Fugaku超级计算机曾于2020年6月至2022年5月期间位居全球最快超级计算机之首,目前在全球超算500强榜单上排名第七。今天宣布的这两款新系统将作为开发平台,为预定于2029年底上线的FugakuNEXT提供参考。新一代超级计算机旨在融合传统超级计算与量子计算,同时结合富士通Monaka X CPU和英伟达架构,通过新的NVLink Fusion硅技术实现。
英伟达近期还宣布了为美国能源部(DoE)建设两台新的超级计算机的计划,分别名为Solstice和Equinox。Solstice将搭载10万个Blackwell GPU,能够提供2000 exaflops的人工智能性能,相当于整个Top500排行榜所有超级计算机AI性能的总和。
此外,英伟达还推出了Apollo,这是一个新的AI物理模型系列,旨在帮助开发者实时运行复杂的工业模拟。这一模型系列涵盖了广泛的实际应用案例,适用于企业的各个行业,均依托英伟达的AI基础设施。具体应用包括汽车、电子和航空航天领域的结构分析,以及电子缺陷检测、机械设计和计算光刻等。Apollo还能进行气候和天气建模、计算流体力学、电磁信号的实时模拟以重建无线通信和光学数据,以及核物理模拟。
一些英伟达的合作伙伴已经开始利用Apollo改进他们的流程。例如,全球第二大芯片设备供应商应用材料公司(Applied Materials)使用Apollo模型提高了制造过程的能效。通过在其CUDA框架上运行这些模型,该公司实现了半导体工艺室的流体、等离子体和热建模,结合AI和数字孪生技术,在其ACE+多物理场模拟平台上实现了35倍的整体加速。诺斯罗普·格鲁曼公司和Luminary Cloud也利用Apollo模型更高效地设计了航天器推进器喷嘴。
在即将到来的数据中心基础设施中,德克萨斯高级计算中心、AI云计算公司CoreWeave和AI工厂初创公司Lambda将采用英伟达Quantum-X Photonics技术。英伟达称,这种共封装光学网络交换机的网络速度可达115 Tbit/s,能够连接数百万个GPU,同时提高应用程序运行时间5倍,能效提高3.5倍。
Nvidia的Quantum-X光子技术将帮助他们实现更加稳健、可维护且节能的网络架构,以支持大规模工作负载快速高效地运行,Nvidia高级HPC和AI基础设施解决方案总监Dion Harris表示。
Harris举例说明,新的网络技术必须与GPU突破相结合,才能驱动最新的混合专家(MoE)模型,例如DeepSeek R1。
Nvidia的解决方案是Blackwell NVL72,其中72个GPU通过全互连、带宽为130 TB/s的NVLink交换机相连。根据SemiAnalysis的数据,在DeepSeek R1上,NVL72在每美元性能、每瓦性能和吞吐量方面均提高了10倍,总体上实现了10倍的收入增长。
“单靠芯片创新无法实现这一点,”Harris说。“我们通过与创新和优化的极端协同设计来实现这一目标。优化涵盖了GPU、CPU、内存、网络、机架规模架构以及软件。”
自SC24以来,Harris称已有80个基于Nvidia系统的新系统被宣布推出,承诺提供300,000个GPU,计划实现相当于4,500 exaflops的人工智能性能。
Arm也成为NVLink的CPU合作伙伴,与现有的富士通、英特尔和高通等合作伙伴并肩。
在扩展其传统网络产品组合的同时,Nvidia还宣布了其NVQLink和CUDA-Q平台的新采用路线图,这些平台将在未来不久将GPU与量子处理器连接起来,延迟小于四微秒。
在SC25上,Nvidia宣布全球有21个超级计算中心将采用NVQLink,包括:
澳大利亚的Pawsey超级计算研究中心
丹麦DCAI运营的Gefion超级计算机
德国尤利希超级计算中心(JSC)
日本国家先进工业科学技术研究所(AIST)的全球研究开发中心(G-QuAT)
韩国科学技术信息研究院(KISTI)
在美国,许多能源部的国家实验室也签署了协议,包括劳伦斯伯克利国家实验室、洛斯阿拉莫斯国家实验室和橡树岭国家实验室(目前托管超级计算机Frontier)。
“执行诸如量子纠错等任务需要具有微秒级延迟和数百吉比特/秒吞吐量的量子GPU互联,”Harris说。
“对于可扩展的互联平台而言,开放性和通用性也是至关重要的,这样每个超级计算机都有一个即插即用的解决方案,可以将量子技术引入它们的工作流程。”
请关注ITPro在Google新闻上的最新报道,以跟踪我们的所有最新新闻、分析和评论。
更多来自ITPro的内容
Nvidia与德意志电信合作打造“主权”工业AI云
黄仁勋认为未来企业将采用‘人类与数字人’的组合
Nvidia对英特尔的投资为其开辟了利润丰厚的新市场
主题
Nvidia
(以上内容均由Ai生成)