英伟达发布Spectrum-XGS技术,助力构建AI超级集群
快速阅读: 英伟达推出Spectrum-XGS Ethernet技术,连接多区域数据中心,形成千亿级AI超级工厂,解决单一数据中心电力和容量极限问题,提升跨域互联性能。
英伟达宣布推出 NVIDIA Spectrum-XGS Ethernet 技术,该技术自今日起作为 NVIDIA Spectrum-X 以太网平台的一部分提供。这项技术面向分布式数据中心的跨域互联,旨在将多个不同区域的独立数据中心连接起来,形成具备千亿级计算能力的 AI 超级工厂。
英伟达介绍,随着 AI 需求的快速增长,单一数据中心在电力和容量上逐渐触及极限。传统以太网在延迟、抖动和性能一致性方面存在局限,导致数据中心难以突破单一设施的边界。NVIDIA Spectrum-XGS Ethernet 为此设计,引入了跨域扩展架构,具备自适应的网络算法,能够根据数据中心之间的距离动态调整:
– 自适应距离拥塞控制:动态优化数据中心间网络传输
– 精准延迟管理:将 NCCL 通信库性能提升近一倍
– 端到端遥测系统:确保地理分散集群的可预测性能
英伟达 CEO 黄仁勋表示:“AI 产业革命已经到来,超大规模的 AI 工厂是关键基础设施。通过 Spectrum-XGS Ethernet,我们在纵向扩展和横向扩展的基础上增加了跨域扩展能力,将分布在城市、国家乃至洲际的数据中心连接成庞大的千亿级 AI 超级工厂。”
云服务商 CoreWeave 已率先采用 Spectrum-XGS Ethernet。该公司联合创始人兼首席技术官 Peter Salanki 表示:“该技术可将我们的数据中心整合为统一的超级计算机。”
此前,英伟达已推出 Spectrum-X 交换机和 ConnectX-8 SuperNIC,用于跨站点连接数百万 GPU,同时降低能耗和运营成本。
(以上内容均由Ai生成)