谷歌云部署Ironwood TPU,实现1.77PB共享内存创新高
快速阅读: 谷歌在Hot Chips 2025大会展示最新TPU“Ironwood”,第七代硬件,专为大规模推理设计,集成双核,FP8算力4,614 TFLOPs,192GB HBM3e显存,I/O带宽1.2TB/s,可扩展至9,216芯片,性能达42.5 ExaFLOPS,共享内存1.77PB,具备故障重配能力,注重稳定性和能效。
9月6日,IT之家报道,在上周的Hot Chips 2025大会上,谷歌展示了其最新一代TPU“Ironwood”,并公布了配套超级计算机的技术细节。Ironwood于今年4月发布,是第七代TPU硬件,也是谷歌首款专为大规模推理负载设计的TPU。该TPU集成双计算核心,FP8精度算力达到4,614 TFLOPs,配备192GB HBM3e显存,带宽可达7.3TB/s。
从系统架构来看,Ironwood的I/O带宽达到1.2TB/s,单个系统最多可扩展至9,216枚芯片,整体性能最高可达42.5 ExaFLOPS。此外,该系统实现1.77PB的共享内存,打破了此前共享内存超级计算机的容量记录。该系统还具备在节点故障时重新配置的能力,并通过检查点恢复任务。
Ironwood的设计注重稳定性,内置可信根、自检功能及静默数据损坏防护机制,同时配备了逻辑修复功能以提高制造良率。整个架构贯彻了可靠性、可用性和可维护性(RAS)的设计理念。散热方面,采用谷歌第三代液冷基础设施,由冷板方案支持。
谷歌表示,Ironwood的能效相比前代Trillium提升了两倍,并支持动态电压与频率调节,以适应不同的负载需求。在设计阶段,Ironwood已应用AI技术优化算术逻辑单元电路及布局规划,新增第四代稀疏核心加速嵌入操作与集合通信,支持推荐引擎等负载。目前,Ironwood已在谷歌云数据中心规模部署,但作为内部平台,暂时不对外部客户开放。
(以上内容均由Ai生成)