Nvidia GTC 2025:所有更新,包括Blackwell Ultra和AI工厂

发布时间:2025年3月19日    来源:szf
Nvidia GTC 2025:所有更新,包括Blackwell Ultra和AI工厂

快速阅读: 据《容量介质》最新报道,Nvidia在GTC 2025上发布Blackwell Ultra及全新AI硬件,涵盖个人AI超级计算机、光子交换机和量子计算研究中心。Blackwell Ultra大幅提升AI推理能力,新交换机节能显著。此外,Nvidia推出开放Llama Nemotron模型家族及Dynamo开源库,助力AI推理与企业数据交互。

在众多公告中,包括全新的硅光子网络交换机、个人AI超级计算机以及在波士顿建立量子计算研究中心的计划。我们还首次看到了Blackwell的下一代进化——Blackwell Ultra。以下是Nvidia GTC 2025的所有主要公告:

**Blackwell更新:认识Ultra与GB300**
尽管第一代Blackwell芯片因硬件故障刚刚发布,但芯片制造商Nvidia正在加倍努力,推出了Blackwell Ultra,这是新一代旨在提升训练和扩展推理能力的硬件。发布了两个版本:
– **GB300 NVL72**:一种机架级解决方案,包含72个Blackwell Ultra GPU和36个Grace CPU,整合为一个巨大的单一AI GPU。这使其能够将复杂请求拆解为多步骤解决方案,从而提高AI推理能力。
– **HGX B300 NVL16**:一种高性能服务器单元,其大型语言模型(LLMs)的推理速度比NVIDIA的Hopper一代GPU快11倍,计算能力提高了7倍,内存增加了4倍。

像AWS、Google Cloud、Microsoft Azure和Oracle Cloud Infrastructure等顶级云服务商将成为首批提供基于Blackwell Ultra实例的服务商。包括戴尔、惠普企业(HPE)、联想和超微(Supermicro)在内的服务器制造商也计划在2025年底推出基于Blackwell Ultra的AI基础设施。Nvidia表示,新的Blackwell Ultra是其在AI推理领域迈出的最大一步:
“Nvidia创始人兼首席执行官黄仁勋提到,新的Ultra系列加入了Nvidia每年的产品节奏,即‘一年一节奏’,计划每年推出一款新的旗舰硬件产品,目前计划在2026年发布下一代Rubin系列,随后在2027年推出Ultra风格的升级版。”

**DGX Spark 和 DGX Station个人AI超级计算机**
Nvidia正通过Blackwell硬件驱动的DGX Spark和DGX Station桌面超级计算机,将超级计算机引入家庭。我们在CES上以“项目DIGITS”的工作名称首次看到了这一概念,设想了一种能够在占用标准台式机空间的同时运行高端AI模型的单元。

– **DGX Spark**:由GB10 Superchip驱动,这是一个经过调整的Blackwell单元,尽管尺寸较小,但仍能支持高达1,000万亿次/秒的AI计算操作,用于微调和推理。
– **DGX Station**:是更强大的版本,Nvidia将其宣传为“将数据中心级别的性能带到桌面上”。它配备了新的B300 Grace Blackwell Ultra桌面超级芯片,并拥有784GB的巨大一致内存空间,以支持大规模训练和推理工作负载。

预计DGX Station将在今年晚些时候由合作伙伴如华硕、戴尔、惠普和超微推出。在成本方面,虽然未公布具体价格,但根据CES期间的报道,低端Spark型号的起价约为3,000美元。

**新的网络交换机——Nvidia现在涉足光子学?**
GTC 2025上最令人惊讶的更新之一是Nvidia加入了日益增长的光子学运动。该公司推出了基于光子学的网络交换机,旨在连接数百万的数据中心GPU,同时大幅减少能源消耗。

– 新的Spectrum-X光子交换机有多种配置,包括128个800Gb/s端口或512个200Gb/s端口——Nvidia声称它们在功率效率上比传统交换机高出3.5倍,在信号完整性上高出63倍,在大规模网络中的恢复力高出10倍。
“通过直接将硅光子集成到交换机中,Nvidia打破了超大规模和企业网络的旧限制,打开了通往百万GPU AI工厂的大门。”黄仁勋说。

同时推出的还有Quantum-X光子交换机,支持144个800Gb/s InfiniBand端口,并采用液冷设计来冷却板载硅光子。Nvidia表示,其新的Quantum-X光子交换机在AI计算结构的速度上比前一代设备快2倍,可扩展性高5倍。

**开放Llama Nemotron:一个开放推理AI模型家族**
在已经发布的电信领域AI模型系列之后,Nvidia还展示了开放Llama Nemotron模型家族,旨在帮助企业构建AI代理。基于Meta的一系列AI模型构建,开放Llama Nemotron据说具备推理能力,可以自主地为企业应用提供动力,或者作为一组共同工作的模型。

这些模型有多种大小,从小型Nano,可以在PC和边缘设备上运行,到中型Super,再到专为多GPU服务器设计的巨型Ultra。早期采用者包括微软,它正在将其纳入Microsoft Azure AI Foundry,以及SAP,它正在使用它们来增强其SAP Business AI解决方案及其AI副驾驶Joule。
“这些先进的推理模型将优化和重写用户查询,使我们的AI更好地理解查询并提供更智能、更高效的AI驱动体验,推动业务创新和发展。”SAP全球AI主管Walter Sun说。

**AI数据平台:一种新的AI代理设计工具**
芯片制造商展示了新的可定制参考设计平台,允许用户构建基础设施以加速AI推理工作负载,使用专业AI查询代理。Nvidia的新AI数据平台旨在为存储提供商服务,使他们能够利用庞大的信息库来驱动AI查询代理。

它带来了Dell Technologies、IBM、HPE和Pure Storage等公司,开发Nvidia提出的能够推理并与企业数据交互的代理AI系统。黄仁勋表示,该平台将帮助构建“新一类企业基础设施,公司需要部署和扩展混合数据中心中的代理AI”。

**AI推理模型的Dynamo开源库**
同时发布的还有Nvidia Dynamo,这是一种开源的推理软件,用于加速和扩展AI推理模型。专为所谓的“AI工厂”或专用AI数据中心使用而设计,Dynamo是Nvidia的Triton推理服务器的继任者。它在数千个GPU之间协调和加速推理通信,使用解耦服务来“在不同GPU上分离大型语言模型(LLMs)的处理和生成阶段”——简单来说,它通过高效调度数千个GPU,分工任务,使得一组GPU处理数据,另一组生成最终输出,从而加快AI响应速度。

Dynamo完全开源,任何人都可以使用(受许可条款约束),并支持PyTorch、SGLang和Nvidia自己的TensorRTTM-LLM。它将通过AWS、Dell、Google Cloud、Microsoft Azure等企业平台以及其他平台提供商提供。

**量子计算研究中心**
除了硬件更新和软件展示外,Nvidia还宣布计划建立一个研究中心以推进量子计算研究。Nvidia加速量子研究研究中心(NVAQC)将位于马萨诸塞州波士顿,任务是帮助解决量子计算的一些最具挑战性的问题,从解决量子比特的噪声问题到设计实验性量子芯片。

“量子计算将提升AI超级计算机的能力,解决一些世界上最重要问题,从药物发现到材料开发。”黄仁勋说。

NVAQC将与Nvidia的商业和学术合作伙伴合作,使用GB200 NVL72硬件运行量子系统的复杂模拟,并开发用于量子研究的AI算法。该站点预计将于今年晚些时候投入运营,EQuS小组(MIT量子工程中心成员)计划使用NVAQC开发量子纠错等技术。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日