Oracle推出Nvidia和AMD芯片驱动的AI集群
快速阅读: 甲骨文宣布建设新AI集群OCI Zettascale10,使用英伟达和AMD芯片,支持最多80万个GPU,预计2026年下半年推出,将提供16泽托秒AI性能。
甲骨文公司今日宣布计划建设由竞争对手英伟达公司和超威半导体公司的芯片驱动的新人工智能集群。首个集群,名为OCI Zettascale10,将在该公司OCI公共云上运行,允许客户配置最多配备80万个英伟达图形处理单元的人工智能环境。此外,甲骨文正在构建一个基于AMD即将推出的旗舰级AI加速器Instinct MI450系列的5万个GPU集群。
人工智能市场其他关键参与者也在使用来自多个供应商的GPU,以避免对单一芯片制造商的过度依赖。甲骨文在云计算市场的主要竞争对手均提供英伟达和AMD的GPU组合。OpenAI委托数据库制造商建造价值3000亿美元的人工智能基础设施,计划部署自定义AI芯片,以补充其当前使用的现成硅片。
支持OCI Zettascale10架构的同一数据中心,甲骨文正在得克萨斯州阿比林为OpenAI建造。该产品将支持多吉瓦特的集群,配备最多80万个英伟达GPU。甲骨文估计,OCI Zettascale10的峰值AI性能将达到16泽托秒(即每秒16万亿亿次计算)。
甲骨文计划使用英伟达的Spectrum-X系列以太网网络设备将OCI Zettascale10集群中的GPU链接起来。该系列产品包括两个主要设备:BlueField-3 SuperNIC芯片,用于连接GPU服务器到数据中心的网络,并从主处理器卸载某些计算任务;以及名为Spectrum SN5000的以太网交换机系列。
甲骨文实施的网络设备技术称为Acceleron RoCE。通常,GPU之间传输数据需要通过托管GPU的服务器的中央处理单元。而Acceleron RoCE跳过了这一步,提高了性能。
甲骨文现已开始接受OCI Zettascale10的订单,预计将于2026年下半年推出。“客户可以使用更少的能源构建、训练并部署他们最大的AI模型,实现高性能下的高可靠性,”甲骨文云基础设施执行副总裁马赫什·蒂亚加拉詹表示,“此外,客户将能够自由地在甲骨文分布式的云端操作,同时享有强大的数据和AI主权控制。”
甲骨文还计划将OCI Zettascale10与配备5万个AMD MI450图形卡的AI集群一同上线。这些GPU将安装在基于AMD新设计的Helios机架中,该设计于今日公布。
每个Helios机架可容纳72个MI450芯片,每个芯片包含高达432GB的HBM4内存。HBM4是一种尚未大规模生产的高速RAM。AMD估计,这项技术将使Helios的内存容量和带宽达到配备英伟达即将推出的Vera Rubin芯片系统的两倍。
Helios机架还包括其他组件,如AMD即将推出的Venice服务器CPU系列和未来的Vulcano数据处理单元。据AMD称,每个Helios机架在处理FP8数据时可提供高达1.4艾佛洛普的性能。该系统采用液冷散热,以去除组件产生的热量。AMD表示,该系统基于双宽度设计,旨在方便技术人员维修故障。公司还将使硬件合作伙伴能够扩展核心Helios功能集,以适应他们的需求。
甲骨文计划在2026年第三季度在其OCI数据中心安装首批配备MI450的Helios机架,并于2027年开始增加更多系统。
由技术先驱约翰·弗里尔和戴夫·韦兰特创立的SiliconANGLE Media,已构建了一个涵盖行业领先数字媒体品牌的动态生态系统,触及超过1500万精英技术专业人士。我们新推出的专有theCUBE AI视频云正在观众互动方面取得突破,利用theCUBEai.com神经网络帮助技术公司做出数据驱动的决策,保持在行业对话的前沿。
(以上内容均由Ai生成)