AWS reInvent 2025:展示AI芯片与灵活服务新进展

发布时间:2025年11月28日    来源:szf
AWS reInvent 2025:展示AI芯片与灵活服务新进展

快速阅读: AWS re:Invent大会即将召开,作为最大云服务提供商,AWS面临微软和谷歌的竞争压力,通过推出Bedrock服务和自研Trainium芯片提升竞争力,预计将在会上展示AI代理和硬件进展。

随着ChatGPT推出即将满三周年,这一事件曾使全球科技行业陷入波动、炒作和夸大之中,现在恰逢其时,看到一位老牌超大规模云服务提供商准备召开年度大会。AWS re:Invent将于下周在拉斯维加斯的威尼斯人酒店正式开幕,这为亚马逊云计算部门提供了一个在年底前发表最后观点的机会。

作为三大主要超大规模云服务商中最古老且最大的一家,AWS在2022年末OpenAI旗舰模型及谷歌的推出中措手不及。这两家公司花费了2023年的大部分时间来追赶,而微软则因与AI公司紧密的合作关系而早早受益。然而,差距正在缩小。正如我们在四月的Google Cloud Next大会上所见,谷歌在过去18个月里取得了进展,最近推出的Gemini 3抢了微软的风头,同时在其最近的Ignite会议上向客户大量宣布了代理AI的消息。

面对竞争对手近几个月的大胆举动,这引发了一个问题:AWS究竟如何打算吸引现有和潜在客户?AWS长期以成熟、资金雄厚且注重易于集成的形象著称,这可能是其未来的关键差异化因素。实际上,该公司在2023年中期通过推出Bedrock服务在这方面取得了显著进展,为客户提供了一系列第三方和内部模型的访问权限。

据《ITPro》当时报道,这展示了AWS能够直击要害,为企业客户提供一条清晰的生成式AI采用路径——同时提供选择的灵活性——而其他公司则过于专注于推动相对单一的技术方法。随着2025年代理AI热潮的持续,公司在这一初步基础上进一步发展,于今年七月扩展了Bedrock,推出了Amazon Bedrock AgentCore和AWS Marketplace上的AI代理与工具服务。

前者允许客户构建和部署代理,后者则让他们有机会从通过AWS合作伙伴提供的多种选项中挑选。这种选择的灵活性已经受到AWS客户的欢迎,我们预计在re:Invent 2025上会看到更多相关内容。

硬件战即将爆发

在硬件方面,显然在AI芯片领域有一场战斗正在酝酿。行业利益相关者吹捧谷歌日益增长的硬件实力,特别是其张量处理单元(TPUs),可能挑战英伟达在AI领域的主导地位。对于AWS而言,我们也可以期待在公司的年度大会上看到大力推动。近年来,AWS一直在加快自主研发AI芯片的开发步伐,这一进程始于2015年收购Annapurna Labs。

最初,该公司在2018年推出了其Inferentia芯片,随后在2022年推出了Trainium。这两个芯片被用于支持通过与Anthropic的合作进行的基础模型训练和开发。随着企业焦点从训练转向推理,AWS将热衷于向客户展示这里的潜力。Trainium2芯片在2023年的re:Invent上亮相,宣称训练速度提高4倍,能效提高2倍。

去年的会议还预告了Trainium3的计划,再次提升了4倍性能并提高了40%的能效。在今年的第三季度财报中,CEO安迪·贾西确认了Project Rainier的启动,该项目由大约50万个Trainium2处理器组成的集群用于训练Anthropic模型,计划到今年年底将容量扩大到约100万。10月下旬,AWS Trainium首席架构师Ron Diamant将其描述为“迄今为止AWS最具雄心的项目之一”。可以肯定的是,公司将乐于在此提供更新。

Anthropic的争夺战

虽然微软有OpenAI作为其明星项目,但AWS对Anthropic进行了重大押注。超大规模云服务商在2023年9月向这家AI初创公司投资了40亿美元,并在一年后加倍支持。

这些承诺中的后者使得Anthropic选择了AWS作为其主要云提供商和训练伙伴。不过,AWS并不是唯一对Anthropic感兴趣的超大规模云服务商。谷歌在2023年承诺投资20亿美元,今年1月又追加了10亿美元。

这里的合作关系错综复杂,显然Anthropic不愿意在基础设施合作伙伴关系上采取单一解决方案。例如,10月,Google Cloud和Anthropic进一步加深了合作,后者扩大了对TPU的使用,以提高训练即将推出的Claude模型所需的计算能力。Anthropic表示,这项协议将使其获得大约一百万个TPU,主要是因为这些TPU具有“价格性能和效率”优势。

对此,AWS势必会作出回应。尽管目前没有迹象表明三方不能共存,但随着Trainium3的即将发布,这家超大规模云服务商将重押自身的成本和能效优势,试图超越Google。随着芯片战争一触即发,企业继续寻求AI投资回报,AWS将依赖其广泛的行业联系和长期的基础设施实力,在re:Invent大会上展示其如何结合规模和灵活性。

ITPro将于12月1日至5日在拉斯维加斯现场报道AWS re:Invent大会,您可以通过我们的实时博客、社交媒体渠道和通讯关注所有最新报道。

(以上内容均由Ai生成)

你可能还想读

三星4nm制程良率突破60%,获超1亿美元AI芯片订单

三星4nm制程良率突破60%,获超1亿美元AI芯片订单

快速阅读: 三星电子4纳米制程良率提升至60%-70%,获美企Tsavorite超1亿美元OPU芯片订单,显示三星在中高端市场重获份额。近期三星还获得中国矿机厂商及特斯拉AI5芯片订单,推进2纳米工艺发展。 12 月 7 日,据韩国媒体《亚 […]

发布时间:2025年12月7日
百度集团:正就分拆昆仑芯进行上市进行评估

百度集团:正就分拆昆仑芯进行上市进行评估

快速阅读: 百度计划分拆昆仑芯科技并筹备上市,预计2026年一季度递交申请,2027年初完成IPO。昆仑芯为百度内部孵化的AI芯片公司,业务增长迅速,2024年营收超10亿元。百度股价受此消息上涨5.01%。 感谢IT之家网友 啊俊 、 D […]

发布时间:2025年12月7日
网红“甲亢哥”直播暴力损毁人形机器人,开发公司起诉索赔

网红“甲亢哥”直播暴力损毁人形机器人,开发公司起诉索赔

快速阅读: 网红IShowSpeed在直播中对人形机器人Rizzbot实施暴力行为,致其严重损坏。Rizzbot开发公司Social Robotics提起诉讼,要求赔偿实际损失和预期利润。 2024年9月,拥有超过5000万粉丝(全平台累计 […]

发布时间:2025年12月7日
AI争议两天内导致PS5、PS4游戏下架

AI争议两天内导致PS5、PS4游戏下架

快速阅读: 顶尖智者预测,未来AI将实现更多功能,各国积极投资,芯片短缺因AI需求激增。目前AI如婴儿,潜力巨大,发展将超越视频游戏等简单应用。 世界顶尖的智者预测,未来人工智能将实现诸多功能,而显然你是正确的!几乎每个国家都在投资人工智能 […]

发布时间:2025年12月7日
英伟达发布CUDA 13.1,引入Tile IR革新GPU编程

英伟达发布CUDA 13.1,引入Tile IR革新GPU编程

快速阅读: 英伟达发布CUDA 13.1,引入CUDA Tile新编程方式,简化AI与加速计算开发,提高代码兼容性和执行效率,支持多代GPU架构。 12月7日,IT之家报道,英伟达本周四发布了全新的CUDA 13.1,这是自2006年CUD […]

发布时间:2025年12月7日
谷歌AI迎头赶上,ChatGPT霸主地位受威胁

谷歌AI迎头赶上,ChatGPT霸主地位受威胁

快速阅读: 谷歌在AI搜索转型初期落后于OpenAI的ChatGPT,但通过Gemini等新产品的推出,逐渐缩小差距,目前在应用下载量和用户参与度上展现强劲增长,正努力重回搜索领域主导地位。 谷歌AI标志 NurPhoto via Gett […]

发布时间:2025年12月7日
政府推AI应用打击非法移民

政府推AI应用打击非法移民

快速阅读: 巴基斯坦政府启动AI应用程序试点,打击非法移民,确保被遣返者不再获签。两部长要求严打假旅行社,改革移民系统,提高签证申请透明度。 伊斯兰堡 —— 联邦政府决定启动一项基于人工智能的应用程序试点项目,以遏制非法移民。该决定是在周五 […]

发布时间:2025年12月7日
摩托罗拉解决方案收购Blue Eye,强化AI安全业务

摩托罗拉解决方案收购Blue Eye,强化AI安全业务

快速阅读: 摩托罗拉解决方案公司2025年第三季度财报超预期,宣布收购Blue Eye,强化公共安全与安保技术。此举促进公司向人工智能视频安全领域发展,提升软件和服务收入,应对传统LMR系统压力。 摩托罗拉解决方案公司近期公布的2025年第 […]

发布时间:2025年12月7日