亚马逊发布Trainium3芯片,性能提升四倍且更节能
快速阅读: AWS推出Trainium3芯片,性能提升四倍,节能40%,支持大规模AI应用。下一代Trainium4芯片研发中,将兼容英伟达技术,进一步提升性能。
亚马逊网络服务(AWS)多年来一直在自主开发人工智能训练芯片,最近推出了名为Trainium3的新版本,其规格令人印象深刻。在周二的AWS re:Invent 2025大会上,这家云服务提供商不仅宣布了这一消息,还透露了其AI训练产品路线图上的下一个产品——Trainium4,该产品正在研发中,并将能够与英伟达的芯片兼容。
在年度技术会议上,AWS正式发布了Trainium3 UltraServer系统,该系统由公司最先进的3纳米Trainium3芯片和自研网络技术驱动。据AWS称,第三代芯片和系统在AI训练和推理性能上相比第二代有显著提升。具体来说,新系统速度提高了四倍,内存容量也增加了四倍,不仅适用于训练,还能在需求高峰时提供AI应用程序。此外,数千台UltraServer可以连接起来,为应用提供高达100万颗Trainium3芯片的支持,比上一代多出十倍。每台UltraServer可容纳144颗芯片。
更重要的是,AWS表示这些芯片和系统比上一代产品节能40%。在全球竞相建设耗电巨大的数据中心之际,数据中心巨头AWS正致力于开发更加节能的系统。这显然符合AWS的直接利益。以亚马逊一贯的成本意识,该公司承诺这些系统也能为AI云客户节省成本。
包括Anthropic(亚马逊也是其投资者)、日本的LLM Karakuri、Splashmusic和Decart在内的AWS客户已经使用了第三代芯片和系统,显著降低了他们的推理成本。
AWS还简要介绍了下一代芯片Trainium4的研发计划,承诺这款芯片将带来更大的性能提升,并支持英伟达的NVLink Fusion高速芯片互连技术。这意味着基于Trainium4的系统不仅能与英伟达GPU互操作,还能在其低成本的服务器机架技术上扩展性能。值得一提的是,英伟达的CUDA已成为所有主要AI应用支持的事实标准,Trainium4系统可能会吸引更多基于英伟达GPU设计的大规模AI应用转向亚马逊云。
亚马逊未公布Trainium4的具体上市时间。如果遵循以往的发布时间表,我们可能在明年的大会上听到更多关于Trainium4的消息。
(以上内容均由Ai生成)