用全球最大芯片打造超算,细节曝光

发布时间:2025年11月3日    来源:szf

👆如果您希望可以时常见面,欢迎标星🌟收藏哦-
来源:内容来自nextplatform,谢谢。
劳伦斯利弗莫尔国家实验室、桑迪亚国家实验室和洛斯阿拉莫斯国家实验室在HPC社区中被简称为”三重实验室”,但这些HPC中心或许可以称为”尝试实验室”,因为它们历史上尝试过几乎任何新的架构,以了解它在推进美国能源部的使命方面可能有何前景。
桑迪亚国家实验室是先锋计划测试新架构的地方,现在它带着CerebrasSystems的第三代晶圆级系统再次回归,希望在一台真正设计用于运行AI训练和推理的机器上突破传统HPC代码的性能障碍。
两年前,桑迪亚从Cerebras收购了数量不详的CS-2系统,每个系统都有一个CPU主机和一个WSE-2晶圆级处理器,目的是将一些矩阵密集的HPC计算卸载到WSE-2引擎上的16位浮点核心上。
为什么桑迪亚甚至会考虑将其64位或32位格式的计算精度降低四倍或两倍?因为这些WSE-2引擎(正如我们在2022年3月详细介绍的那样)将850,000个内核和40GB的片上SRAM内存(蚀刻在2.6万亿个晶体管中)塞进一个餐盘大小的方形硅片中,具有20PB/秒的内存带宽和6.25千万亿次浮点运算的密集矩阵和62.5千万亿次浮点运算的稀疏矩阵。
我们的想法是,对于某些类型的工作负载,如果问题适合内存,或者可以分解为跨越这些核心的部分,那么在单个大型设备上进行计算可以使HPC模拟运行得更快。
今年早些时候,桑迪亚国家实验室的一个研究小组证明了这一点,单个CS-2系统在某种分子动力学模拟中击败了橡树岭国家实验室的”Frontier”超级计算机。
更大的Frontier机器拥有37,632个AMD”Aldebaran”MI250XGPU加速器,可以模拟晶格中的大量原子,但由于这些GPU集群的扩展性较弱,它无法模拟长时间摆动的原子。节点之间的延迟使这成为不可能。
但是,使用改进的LAMMPS分子动力学模拟,桑迪亚设立了一个测试,其中钨、铜和钽晶格由静态原子数组成——801,792,足以让一个WSE-2核心保存一个原子的数据——然后模拟这些晶格受到辐射冲击。与庞大的Frontier系统中的GPU相比,桑迪亚在一台WSE-2计算引擎上进行的LAMMPS模拟中每秒可处理的时间步数对于铜高109倍,对于钨高96倍,对于钽高179倍。这为Cerebras铁上的模拟提供了数十毫秒的时间,正如我们当时指出的那样,有足够的时间来实际观察当你用能量戳晶格时晶格会发生什么。
在Frontier机器上,该应用程序的扩展在32个GPU时逐渐减弱,这令人失望,并且表明对于某些类型的应用程序来说,很难在单个计算设备之外进行扩展。
当时,我们推测,如果Sandia升级到今年3月推出的CS-3系统中的WSE-3计算引擎,它就可以赢得更多时间(即模拟时间)。借助WSE-3引擎,Cerebras将晶体管缩小到5纳米(WSE-2为7纳米),并将核心数量增加到900,000个,但转移到8宽FP16SIMD单元,是WSE-2和WSE-1引擎中使用的SIMD单元宽度的两倍。我们认为WSE-3的时钟速度提高了约5%,当你将时钟速度、核心跳跃和SIMD提升相乘时,这就是WSE-3的性能是WSE-2的2倍的原因。
我们猜测,通过从WSE-2移至WSE-3,这种性能提升可能会将钽晶格辐射的模拟窗口从40毫秒增加到80毫秒。相比之下,Frontier机器上的这些节点模拟时间约为200纳秒。
嗯,看起来桑迪亚国家实验室的人们想要获得一些WSE-3计算引擎并一探究竟。我们还强烈怀疑他们想弄清楚是否可以将模拟扩展到多个晶圆上并突破1秒模拟障碍。
也许是为了这个目的,也为了其他目的,桑迪亚国家实验室和Cerebras已经开始构建一个绰号为”Kingfisher”的系统,该系统将以四个CS-3系统开始,并将在未来某个时候扩展到八个系统。Kingfisher集群将在传统的HPC模拟工作和AI工作上加倍努力——当然是生成式AI,但不一定仅限于此——这可以增强三实验室在国家核安全局的支持下进行的处理,该局资助三实验室管理美国军方的核武器库存。具体来说,Kingfisher是由核威慑高级模拟和计算人工智能计划资助的。
桑迪亚研究人员ThucHoang、AnnGentile、AndrewYounge、SiHammond、JamesLaros和KevinStroup站在Kingfisher旁边。
在宣布Kingfisher系统的声明中,一直领导桑迪亚CS-2系统工作的研究人员之一JamesLaros表示,实验室正在探索使用未来版本的WSE计算引擎”用于Mod-Sim和AI工作负载的组合”的可行性。我们过去曾与Cerebras联合创始人兼首席执行官AndrewFeldman开玩笑说,世界真正需要的是一个拥有64位SIMD引擎的WSE,该引擎可以扩展到FP64精度,甚至可以降低到FP4精度,并且可以动态执行,可能是在晶圆上的不同块中,也可能是在代码运行时动态执行,因此理论上HPC中心的任何代码都可以在Cerebras硬件上运行。
如果有足够多的人这么说,并且有足够多的人为此提供资金,也许这就会实现。对我们来说,这些都不是笑翠鸟。Nvidia不再专注于其GPU的FP64性能。
Kingfisher系统的成本尚未公布,但我们知道,按照标价(无论HPC领域的标价是多少),去年G42开始与Cerebras合作,基于CS-2机器构建”CondorGalaxy”集群时,配备单个WSE-2的CS-2系统的成本约为160万美元。也许这意味着要获得CS-3,价格要上涨1.5倍,或者可能上涨2倍。在一个要求每一代都物有所值的世界里,230万美元到250万美元可能是合理的。在一个需要更高性能且选择很少的世界里,320万美元的CS-3节点成本是合理的。无论如何,我们认为桑迪亚不会为机器支付接近标价的价格,但同时希望帮助资助那些可能帮助其更好地运行模拟的公司。我们可以肯定地告诉你的是,Frontier的32GPU部分仅花费约425,000美元,但它只能扩展到这么大。
那么,增加原子数量和增加模拟时间对NNSA来说有什么价值呢?可能价值很大。
我们期待进一步了解Kingfisher所做的事情以及它是如何做到的。
最后一件事:桑迪亚团队在Cerbras晶圆级系统上进行的分子动力学研究将角逐今年的戈登贝尔奖。我们希望他们能获奖,这样GPU供应商们就得时刻保持警惕了。
原文链接

Sandia To Push Both HPC And AI With Cerebras “Kingfisher” Cluster


END
👇半导体精品公众号推荐👇
▲点击上方名片即可关注
专注半导体领域更多原创内容
▲点击上方名片即可关注
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3949期内容,欢迎关注。
推荐阅读
★EUV光刻机重磅报告,美国发布
★碳化硅”狂飙”:追赶、内卷、替代
★芯片巨头,都想”干掉”工程师!
★苹果,玩转先进封装
★GPU的历史性时刻!
★大陆集团,开发7nm芯片
★张忠谋最新采访:中国会找到反击方法
★EUV光刻的新”救星”
‘半导体第一垂直媒体’
实时专业原创深度
公众号ID:icbank
喜欢我们的内容就点”在看”分享给小伙伴哦

你可能还想读

Default Image

欧美最顶尖的5家云厂商,都在押注什么?

大数据产业创新服务媒体 ——聚焦数据·改变商业 在数字时代的大潮中,人工智能技术如同一股强劲东风,正以前所未有的速度席卷全球云服务行业,推动其步入前所未有的智能升级阶段。随着计算能力的飞跃与数据量的爆炸性增长,AI技术在云服务领域的融合应用 […]

发布时间:2025年11月3日
Default Image

台积电表忠心的速度有点快

近期有消息称,美国已要求台积电从11月11日开始,停止向中国大陆客户运送常用于人工智能(AI)应用领域的先进芯片,专门针对我国的人工智能领域。此消息虽然没有官宣,不过据了解这条消息基本属实,目前国内公司如果想做高性能AI相关芯片,台积电大概 […]

发布时间:2025年11月3日
Default Image

AI行业存在泡沫吗?

观·察 泡沫的形成是技术发展吸引投资的必要过程,而泡沫的破灭则可以促使社会和制度进行调整,为新技术的全面应用和经济的可持续增长创造条件。 ——陈永伟 图片来源:东方IC AI行业存在泡沫吗? 文/陈永伟 前几天,AI(人工智能)圈出了一件大 […]

发布时间:2025年11月3日
Default Image

外媒:台积电停供大陆7纳米AI芯片

据路透社10日报道,美国商务部致函台积电,要求从11日开始停止向中国大陆客户供应7纳米及更先进工艺的AI芯片。这一出口限制措施主要针对用于人工智能加速器以及图形处理单元(GPU)的芯片。 报道称,美商务部的这封信函允许美国绕过相关规则制定过 […]

发布时间:2025年11月3日
Default Image

李彦宏:智能体是AI应用的最主流形态 即将迎来爆发点

“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。” 11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具”秒哒”。 […]

发布时间:2025年11月3日
Default Image

AI闯关双十一:受伤的还是人类

或许大家还没意识到今天才是双十一。因为当双十一这天真来了,人们的感觉却是”双十一购物节”已经结束了。 步入”16岁”的双十一,从”光棍节”到”购物节”。在经历了奥数般的计算、复杂的玩法、到点蹲点抢红包等等规则后,今年的消费者显得格外疲倦。 […]

发布时间:2025年11月3日
Default Image

NPU:真需求?假创新?

👆如果您希望可以时常见面,欢迎标星🌟收藏哦- 来源:内容编译自theregister,谢谢。 如果您现在还没有听说过神经处理单元(NPU),那么您一定错过了英特尔、AMD和高通一年的人工智能营销。 在过去的12个月中,这些专注于AI的处理器 […]

发布时间:2025年11月3日
Default Image

是时候重新认识To B圈的「双11」了

“双11″曾是一场商业与技术的伟力创造的”奇观”。但对于toB圈而言,只有当它造就的”奇观”成为寻常,下一个奇迹才会诞生。 11月11日,时针指向23点59分,杭州阿里巴巴云谷园区灯火通明。阿里云双11″作战指挥室”数据监控大屏上,销售额以 […]

发布时间:2025年11月3日