用全球最大芯片打造超算,细节曝光

发布时间:2025年11月3日    来源:szf

👆如果您希望可以时常见面,欢迎标星🌟收藏哦-
来源:内容来自nextplatform,谢谢。
劳伦斯利弗莫尔国家实验室、桑迪亚国家实验室和洛斯阿拉莫斯国家实验室在HPC社区中被简称为”三重实验室”,但这些HPC中心或许可以称为”尝试实验室”,因为它们历史上尝试过几乎任何新的架构,以了解它在推进美国能源部的使命方面可能有何前景。
桑迪亚国家实验室是先锋计划测试新架构的地方,现在它带着CerebrasSystems的第三代晶圆级系统再次回归,希望在一台真正设计用于运行AI训练和推理的机器上突破传统HPC代码的性能障碍。
两年前,桑迪亚从Cerebras收购了数量不详的CS-2系统,每个系统都有一个CPU主机和一个WSE-2晶圆级处理器,目的是将一些矩阵密集的HPC计算卸载到WSE-2引擎上的16位浮点核心上。
为什么桑迪亚甚至会考虑将其64位或32位格式的计算精度降低四倍或两倍?因为这些WSE-2引擎(正如我们在2022年3月详细介绍的那样)将850,000个内核和40GB的片上SRAM内存(蚀刻在2.6万亿个晶体管中)塞进一个餐盘大小的方形硅片中,具有20PB/秒的内存带宽和6.25千万亿次浮点运算的密集矩阵和62.5千万亿次浮点运算的稀疏矩阵。
我们的想法是,对于某些类型的工作负载,如果问题适合内存,或者可以分解为跨越这些核心的部分,那么在单个大型设备上进行计算可以使HPC模拟运行得更快。
今年早些时候,桑迪亚国家实验室的一个研究小组证明了这一点,单个CS-2系统在某种分子动力学模拟中击败了橡树岭国家实验室的”Frontier”超级计算机。
更大的Frontier机器拥有37,632个AMD”Aldebaran”MI250XGPU加速器,可以模拟晶格中的大量原子,但由于这些GPU集群的扩展性较弱,它无法模拟长时间摆动的原子。节点之间的延迟使这成为不可能。
但是,使用改进的LAMMPS分子动力学模拟,桑迪亚设立了一个测试,其中钨、铜和钽晶格由静态原子数组成——801,792,足以让一个WSE-2核心保存一个原子的数据——然后模拟这些晶格受到辐射冲击。与庞大的Frontier系统中的GPU相比,桑迪亚在一台WSE-2计算引擎上进行的LAMMPS模拟中每秒可处理的时间步数对于铜高109倍,对于钨高96倍,对于钽高179倍。这为Cerebras铁上的模拟提供了数十毫秒的时间,正如我们当时指出的那样,有足够的时间来实际观察当你用能量戳晶格时晶格会发生什么。
在Frontier机器上,该应用程序的扩展在32个GPU时逐渐减弱,这令人失望,并且表明对于某些类型的应用程序来说,很难在单个计算设备之外进行扩展。
当时,我们推测,如果Sandia升级到今年3月推出的CS-3系统中的WSE-3计算引擎,它就可以赢得更多时间(即模拟时间)。借助WSE-3引擎,Cerebras将晶体管缩小到5纳米(WSE-2为7纳米),并将核心数量增加到900,000个,但转移到8宽FP16SIMD单元,是WSE-2和WSE-1引擎中使用的SIMD单元宽度的两倍。我们认为WSE-3的时钟速度提高了约5%,当你将时钟速度、核心跳跃和SIMD提升相乘时,这就是WSE-3的性能是WSE-2的2倍的原因。
我们猜测,通过从WSE-2移至WSE-3,这种性能提升可能会将钽晶格辐射的模拟窗口从40毫秒增加到80毫秒。相比之下,Frontier机器上的这些节点模拟时间约为200纳秒。
嗯,看起来桑迪亚国家实验室的人们想要获得一些WSE-3计算引擎并一探究竟。我们还强烈怀疑他们想弄清楚是否可以将模拟扩展到多个晶圆上并突破1秒模拟障碍。
也许是为了这个目的,也为了其他目的,桑迪亚国家实验室和Cerebras已经开始构建一个绰号为”Kingfisher”的系统,该系统将以四个CS-3系统开始,并将在未来某个时候扩展到八个系统。Kingfisher集群将在传统的HPC模拟工作和AI工作上加倍努力——当然是生成式AI,但不一定仅限于此——这可以增强三实验室在国家核安全局的支持下进行的处理,该局资助三实验室管理美国军方的核武器库存。具体来说,Kingfisher是由核威慑高级模拟和计算人工智能计划资助的。
桑迪亚研究人员ThucHoang、AnnGentile、AndrewYounge、SiHammond、JamesLaros和KevinStroup站在Kingfisher旁边。
在宣布Kingfisher系统的声明中,一直领导桑迪亚CS-2系统工作的研究人员之一JamesLaros表示,实验室正在探索使用未来版本的WSE计算引擎”用于Mod-Sim和AI工作负载的组合”的可行性。我们过去曾与Cerebras联合创始人兼首席执行官AndrewFeldman开玩笑说,世界真正需要的是一个拥有64位SIMD引擎的WSE,该引擎可以扩展到FP64精度,甚至可以降低到FP4精度,并且可以动态执行,可能是在晶圆上的不同块中,也可能是在代码运行时动态执行,因此理论上HPC中心的任何代码都可以在Cerebras硬件上运行。
如果有足够多的人这么说,并且有足够多的人为此提供资金,也许这就会实现。对我们来说,这些都不是笑翠鸟。Nvidia不再专注于其GPU的FP64性能。
Kingfisher系统的成本尚未公布,但我们知道,按照标价(无论HPC领域的标价是多少),去年G42开始与Cerebras合作,基于CS-2机器构建”CondorGalaxy”集群时,配备单个WSE-2的CS-2系统的成本约为160万美元。也许这意味着要获得CS-3,价格要上涨1.5倍,或者可能上涨2倍。在一个要求每一代都物有所值的世界里,230万美元到250万美元可能是合理的。在一个需要更高性能且选择很少的世界里,320万美元的CS-3节点成本是合理的。无论如何,我们认为桑迪亚不会为机器支付接近标价的价格,但同时希望帮助资助那些可能帮助其更好地运行模拟的公司。我们可以肯定地告诉你的是,Frontier的32GPU部分仅花费约425,000美元,但它只能扩展到这么大。
那么,增加原子数量和增加模拟时间对NNSA来说有什么价值呢?可能价值很大。
我们期待进一步了解Kingfisher所做的事情以及它是如何做到的。
最后一件事:桑迪亚团队在Cerbras晶圆级系统上进行的分子动力学研究将角逐今年的戈登贝尔奖。我们希望他们能获奖,这样GPU供应商们就得时刻保持警惕了。
原文链接

Sandia To Push Both HPC And AI With Cerebras “Kingfisher” Cluster


END
👇半导体精品公众号推荐👇
▲点击上方名片即可关注
专注半导体领域更多原创内容
▲点击上方名片即可关注
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3949期内容,欢迎关注。
推荐阅读
★EUV光刻机重磅报告,美国发布
★碳化硅”狂飙”:追赶、内卷、替代
★芯片巨头,都想”干掉”工程师!
★苹果,玩转先进封装
★GPU的历史性时刻!
★大陆集团,开发7nm芯片
★张忠谋最新采访:中国会找到反击方法
★EUV光刻的新”救星”
‘半导体第一垂直媒体’
实时专业原创深度
公众号ID:icbank
喜欢我们的内容就点”在看”分享给小伙伴哦

你可能还想读

Default Image

AI眼镜厂商Solos发布两款新智能眼镜,售价249美元起

36氪获悉,AI眼镜厂商Solos在香港举办的2025智能眼镜研讨会上官宣了新一代智能眼镜产品。此次新品拓展了其AirGo产品线,带来了两款新产品:聚焦音频交互的AirGo™ A5和具备视频功能的AI眼镜AirGo™ V2。Solos Ai […]

发布时间:2025年11月3日
Default Image

大模型为深度伪造带来土壤,业界呼吁跨学科联合攻坚鉴伪技术

·鉴伪技术开发需要跨学科合作,当前的鉴伪技术以软件算法为主,未来将走向软硬一体。大模型兴起为深度伪造带来土壤,业界呼吁跨学科联合攻坚鉴伪技术。在大模型时代,人工智能合成语音与真实语音之间的界限变得越发模糊,提升与之匹配的识别技术迫在眉睫。7 […]

发布时间:2025年11月3日
Default Image

小米AI眼镜发布,支持“看一下支付”,1999元起

6月26日,小米重磅发布“面向下一代的个人智能设备”——小米AI眼镜。全新小米AI眼镜具备可支付功能,内置支付宝“看一下支付”,方便用户在双手忙碌或不便使用手机时,通过眼镜扫码支付,安全又便捷。据悉,小米AI眼镜现已开售,1999元起。小米 […]

发布时间:2025年11月3日
Default Image

小米AI眼镜发布,支持“看一下支付”,1999元起

6月26日,小米重磅发布“面向下一代的个人智能设备”——小米AI眼镜。全新小米AI眼镜具备可支付功能,内置支付宝“看一下支付”,方便用户在双手忙碌或不便使用手机时,通过眼镜扫码支付,安全又便捷。据悉,小米AI眼镜现已开售,1999元起。小米 […]

发布时间:2025年11月3日
Default Image

小米首款AI眼镜在京东开售 1999元起晒单享3期免息

6月26日,小米正式推出其首款AI眼镜,定位为“面向下个时代的个人智能设备”,目前已在京东同步上架开售,售价1999元起,叠加国补优惠后到手价低至1699元。京东还为该款AI眼镜推出限时福利,京东购机用户可参与抽奖,有4台免单机会,晒单用户 […]

发布时间:2025年11月3日
Default Image

6月国产手机各价位段销量冠军出炉:华为中高端齐开花

【CNMO科技消息】近日,有数码博主曝光了2025年6月国产手机各价位段销量冠军机型。CNMO注意到,华为在中高端市场全面领先,实现“齐开花”的强势表现;OPPO Reno14则包揽全价位段和部分中端市场冠军;vivo则在特定区间占据优势。 […]

发布时间:2025年11月3日
Default Image

华为发布Pura80系列手机 售价6499元起

观点网讯:6月11日,华为召开Pura80系列及全场景新品发布会,发布了Pura80系列手机、华为WATCH5等产品。据悉,华为Pura80系列包括Pura80,Pura80 Pro及Pro+,Pura80 Ultra四款产品。发布会上,华 […]

发布时间:2025年11月3日
Default Image

2699元起 华为nova10系列今日发布_TechWeb

【TechWeb】2022年7月4日,华为正式发布华为nova10系列新品手机。华为nova10系列将于2022年7月8日10:08正式开售,共有“10号色”“曜金黑” “普罗旺斯““绮境森林”四种颜色提供选择。其中华为nova10 128 […]

发布时间:2025年11月3日