AI

英伟达计划2026年用光通信连接AI GPU,下一代数据中心或成标配

发布时间:2025年8月25日    来源:szf
英伟达计划2026年用光通信连接AI GPU,下一代数据中心或成标配

快速阅读: 英伟达宣布2026年推出采用CPO技术的Quantum-X和Spectrum-X光互连平台,提升数据传输速率和能效,减少功耗和延迟,满足大规模AI集群需求。

英伟达在今年早些时候宣布,其下一代机架规模的人工智能平台将采用硅光子互连技术,配备共封装光学元件(CPO),以实现更高的传输速率和更低的功耗。今年在Hot Chips会议上,英伟达发布了关于其下一代Quantum-X和Spectrum-X光互连解决方案的更多信息,并透露这些产品将于2026年上市。

英伟达的技术路线图预计会紧随台积电的COUPE路线图,分三个阶段展开。第一代是用于OSFP连接器的光引擎,提供1.6 Tb/s的数据传输速度,同时降低功耗。第二代采用CoWoS封装技术,集成共封装光学元件,使主板级别的数据传输速率达到6.4 Tb/s。第三代目标是在处理器封装内实现12.8 Tb/s的数据传输速率,并进一步减少功耗和延迟。

为什么选择CPO?

在大规模人工智能集群中,数千个GPU需要协同工作,这给处理器之间的互连带来了挑战。传统的每个机架配备一级(Top-of-Rack)交换机并通过短铜缆相连的方式不再适用。为了创建一个低延迟的网络结构,交换机被移至机架行尾,这大大增加了服务器与首个交换机之间的距离,使得铜缆在800 Gb/s的速度下变得不切实际,因此需要光连接来实现几乎所有的服务器到交换机和交换机之间的链接。

在这样的环境中使用可插拔光模块存在明显的局限性:数据信号离开ASIC后,需经过电路板和连接器才能转换为光信号,这一过程会产生严重的电信号损耗,最高可达约22分贝,这需要复杂的补偿机制,导致每个端口的功耗增加到30W,进而需要额外的冷却措施并成为潜在的故障点。随着人工智能部署规模的扩大,这种问题变得难以忍受,英伟达指出。

CPO通过将光转换引擎直接嵌入交换ASIC旁边,避免了传统可插拔光模块带来的损失。信号几乎立即耦合到光纤中,而不是经过长距离的电信号传输,从而将电信号损耗降至4分贝,每个端口的功耗降至9W。这种布局减少了多个可能失效的组件,极大地简化了光互连的实施。

英伟达表示,通过放弃传统的可插拔收发器并将光引擎直接集成到交换芯片中(借助台积电的COUPE平台),实现了效率、可靠性和可扩展性的显著提升。与可插拔模块相比,CPO的改进非常显著:能效提高3.5倍,信号完整性提升64倍,由于活动设备数量减少,可靠性提高了10倍,部署时间也缩短了约30%,因为服务和组装变得更加简单。

英伟达将在以太网和InfiniBand技术中引入基于CPO的光互连平台。首先,该公司计划在2026年初推出Quantum-X InfiniBand交换机。每台交换机将提供115 Tb/s的吞吐量,支持144个800 Gb/s的端口。系统还集成了一个14.4 TFLOPS的网络处理ASIC,支持英伟达第四代可扩展层次聚合减少协议(SHARP),以降低集体操作的延迟。这些交换机将采用液冷技术。

与此同时,英伟达还计划在2026年下半年通过其Spectrum-X光子平台将CPO引入以太网。该平台将依赖于Spectrum-6 ASIC,驱动两个设备:SN6810提供102.4 Tb/s的带宽,拥有128个800 Gb/s的端口;更大的SN6800则扩展到409.6 Tb/s,同样拥有512个800 Gb/s的端口。这两款设备也将采用液冷技术。

Nvidia 认为,其基于 CPO 的交换机将为生成式人工智能应用提供新的 AI 集群,这些应用正变得越来越大且复杂。由于采用 CPO 技术,这些集群将消除数千个独立组件,从而实现更快的安装、更简便的维护和更低的功耗。因此,使用 Quantum-X InfiniBand 和 Spectrum-X 光学技术的集群在启动时间、首次生成时间及长期可靠性方面表现出色。

Nvidia 强调,共封装光学不是可选增强,而是未来 AI 数据中心的结构性需求。这意味着 Nvidia 将把其光学互连作为与 AMD 等竞争对手相比的关键优势之一。这也是 AMD 收购 Enosemi 的原因。

关于 Nvidia 的硅光子项目,重要的一点是其发展与台积电的 COUPE 平台紧密相关,后者将在未来几年内不断进化,从而进一步提升 Nvidia 的 CPO 平台性能。台积电的第一代 COUPE 通过叠加 65nm 电子集成电路和光子集成电路,并采用 SoIC-X 封装技术制造而成。

台积电的 COUPE 路线图分为三个阶段。第一代是用于 OSFP 连接器的光学引擎,提供 1.6 Tb/s 的数据传输速率,同时降低功耗。第二代将采用 CoWoS 封装技术,实现主板级别的 6.4 Tb/s 传输速率。第三代目标是在处理器封装内实现 12.8 Tb/s 的传输速率,并进一步降低功耗和延迟。

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日