AWS reInvent 2025:展示AI芯片与灵活服务新进展
快速阅读: AWS re:Invent大会即将召开,作为最大云服务提供商,AWS面临微软和谷歌的竞争压力,通过推出Bedrock服务和自研Trainium芯片提升竞争力,预计将在会上展示AI代理和硬件进展。
随着ChatGPT推出即将满三周年,这一事件曾使全球科技行业陷入波动、炒作和夸大之中,现在恰逢其时,看到一位老牌超大规模云服务提供商准备召开年度大会。AWS re:Invent将于下周在拉斯维加斯的威尼斯人酒店正式开幕,这为亚马逊云计算部门提供了一个在年底前发表最后观点的机会。
作为三大主要超大规模云服务商中最古老且最大的一家,AWS在2022年末OpenAI旗舰模型及谷歌的推出中措手不及。这两家公司花费了2023年的大部分时间来追赶,而微软则因与AI公司紧密的合作关系而早早受益。然而,差距正在缩小。正如我们在四月的Google Cloud Next大会上所见,谷歌在过去18个月里取得了进展,最近推出的Gemini 3抢了微软的风头,同时在其最近的Ignite会议上向客户大量宣布了代理AI的消息。
面对竞争对手近几个月的大胆举动,这引发了一个问题:AWS究竟如何打算吸引现有和潜在客户?AWS长期以成熟、资金雄厚且注重易于集成的形象著称,这可能是其未来的关键差异化因素。实际上,该公司在2023年中期通过推出Bedrock服务在这方面取得了显著进展,为客户提供了一系列第三方和内部模型的访问权限。
据《ITPro》当时报道,这展示了AWS能够直击要害,为企业客户提供一条清晰的生成式AI采用路径——同时提供选择的灵活性——而其他公司则过于专注于推动相对单一的技术方法。随着2025年代理AI热潮的持续,公司在这一初步基础上进一步发展,于今年七月扩展了Bedrock,推出了Amazon Bedrock AgentCore和AWS Marketplace上的AI代理与工具服务。
前者允许客户构建和部署代理,后者则让他们有机会从通过AWS合作伙伴提供的多种选项中挑选。这种选择的灵活性已经受到AWS客户的欢迎,我们预计在re:Invent 2025上会看到更多相关内容。
硬件战即将爆发
在硬件方面,显然在AI芯片领域有一场战斗正在酝酿。行业利益相关者吹捧谷歌日益增长的硬件实力,特别是其张量处理单元(TPUs),可能挑战英伟达在AI领域的主导地位。对于AWS而言,我们也可以期待在公司的年度大会上看到大力推动。近年来,AWS一直在加快自主研发AI芯片的开发步伐,这一进程始于2015年收购Annapurna Labs。
最初,该公司在2018年推出了其Inferentia芯片,随后在2022年推出了Trainium。这两个芯片被用于支持通过与Anthropic的合作进行的基础模型训练和开发。随着企业焦点从训练转向推理,AWS将热衷于向客户展示这里的潜力。Trainium2芯片在2023年的re:Invent上亮相,宣称训练速度提高4倍,能效提高2倍。
去年的会议还预告了Trainium3的计划,再次提升了4倍性能并提高了40%的能效。在今年的第三季度财报中,CEO安迪·贾西确认了Project Rainier的启动,该项目由大约50万个Trainium2处理器组成的集群用于训练Anthropic模型,计划到今年年底将容量扩大到约100万。10月下旬,AWS Trainium首席架构师Ron Diamant将其描述为“迄今为止AWS最具雄心的项目之一”。可以肯定的是,公司将乐于在此提供更新。
Anthropic的争夺战
虽然微软有OpenAI作为其明星项目,但AWS对Anthropic进行了重大押注。超大规模云服务商在2023年9月向这家AI初创公司投资了40亿美元,并在一年后加倍支持。
这些承诺中的后者使得Anthropic选择了AWS作为其主要云提供商和训练伙伴。不过,AWS并不是唯一对Anthropic感兴趣的超大规模云服务商。谷歌在2023年承诺投资20亿美元,今年1月又追加了10亿美元。
这里的合作关系错综复杂,显然Anthropic不愿意在基础设施合作伙伴关系上采取单一解决方案。例如,10月,Google Cloud和Anthropic进一步加深了合作,后者扩大了对TPU的使用,以提高训练即将推出的Claude模型所需的计算能力。Anthropic表示,这项协议将使其获得大约一百万个TPU,主要是因为这些TPU具有“价格性能和效率”优势。
对此,AWS势必会作出回应。尽管目前没有迹象表明三方不能共存,但随着Trainium3的即将发布,这家超大规模云服务商将重押自身的成本和能效优势,试图超越Google。随着芯片战争一触即发,企业继续寻求AI投资回报,AWS将依赖其广泛的行业联系和长期的基础设施实力,在re:Invent大会上展示其如何结合规模和灵活性。
ITPro将于12月1日至5日在拉斯维加斯现场报道AWS re:Invent大会,您可以通过我们的实时博客、社交媒体渠道和通讯关注所有最新报道。
(以上内容均由Ai生成)