AWS reInvent 2025:展示AI芯片与灵活服务新进展

发布时间:2025年11月28日    来源:szf
AWS reInvent 2025:展示AI芯片与灵活服务新进展

快速阅读: AWS re:Invent大会即将召开,作为最大云服务提供商,AWS面临微软和谷歌的竞争压力,通过推出Bedrock服务和自研Trainium芯片提升竞争力,预计将在会上展示AI代理和硬件进展。

随着ChatGPT推出即将满三周年,这一事件曾使全球科技行业陷入波动、炒作和夸大之中,现在恰逢其时,看到一位老牌超大规模云服务提供商准备召开年度大会。AWS re:Invent将于下周在拉斯维加斯的威尼斯人酒店正式开幕,这为亚马逊云计算部门提供了一个在年底前发表最后观点的机会。

作为三大主要超大规模云服务商中最古老且最大的一家,AWS在2022年末OpenAI旗舰模型及谷歌的推出中措手不及。这两家公司花费了2023年的大部分时间来追赶,而微软则因与AI公司紧密的合作关系而早早受益。然而,差距正在缩小。正如我们在四月的Google Cloud Next大会上所见,谷歌在过去18个月里取得了进展,最近推出的Gemini 3抢了微软的风头,同时在其最近的Ignite会议上向客户大量宣布了代理AI的消息。

面对竞争对手近几个月的大胆举动,这引发了一个问题:AWS究竟如何打算吸引现有和潜在客户?AWS长期以成熟、资金雄厚且注重易于集成的形象著称,这可能是其未来的关键差异化因素。实际上,该公司在2023年中期通过推出Bedrock服务在这方面取得了显著进展,为客户提供了一系列第三方和内部模型的访问权限。

据《ITPro》当时报道,这展示了AWS能够直击要害,为企业客户提供一条清晰的生成式AI采用路径——同时提供选择的灵活性——而其他公司则过于专注于推动相对单一的技术方法。随着2025年代理AI热潮的持续,公司在这一初步基础上进一步发展,于今年七月扩展了Bedrock,推出了Amazon Bedrock AgentCore和AWS Marketplace上的AI代理与工具服务。

前者允许客户构建和部署代理,后者则让他们有机会从通过AWS合作伙伴提供的多种选项中挑选。这种选择的灵活性已经受到AWS客户的欢迎,我们预计在re:Invent 2025上会看到更多相关内容。

硬件战即将爆发

在硬件方面,显然在AI芯片领域有一场战斗正在酝酿。行业利益相关者吹捧谷歌日益增长的硬件实力,特别是其张量处理单元(TPUs),可能挑战英伟达在AI领域的主导地位。对于AWS而言,我们也可以期待在公司的年度大会上看到大力推动。近年来,AWS一直在加快自主研发AI芯片的开发步伐,这一进程始于2015年收购Annapurna Labs。

最初,该公司在2018年推出了其Inferentia芯片,随后在2022年推出了Trainium。这两个芯片被用于支持通过与Anthropic的合作进行的基础模型训练和开发。随着企业焦点从训练转向推理,AWS将热衷于向客户展示这里的潜力。Trainium2芯片在2023年的re:Invent上亮相,宣称训练速度提高4倍,能效提高2倍。

去年的会议还预告了Trainium3的计划,再次提升了4倍性能并提高了40%的能效。在今年的第三季度财报中,CEO安迪·贾西确认了Project Rainier的启动,该项目由大约50万个Trainium2处理器组成的集群用于训练Anthropic模型,计划到今年年底将容量扩大到约100万。10月下旬,AWS Trainium首席架构师Ron Diamant将其描述为“迄今为止AWS最具雄心的项目之一”。可以肯定的是,公司将乐于在此提供更新。

Anthropic的争夺战

虽然微软有OpenAI作为其明星项目,但AWS对Anthropic进行了重大押注。超大规模云服务商在2023年9月向这家AI初创公司投资了40亿美元,并在一年后加倍支持。

这些承诺中的后者使得Anthropic选择了AWS作为其主要云提供商和训练伙伴。不过,AWS并不是唯一对Anthropic感兴趣的超大规模云服务商。谷歌在2023年承诺投资20亿美元,今年1月又追加了10亿美元。

这里的合作关系错综复杂,显然Anthropic不愿意在基础设施合作伙伴关系上采取单一解决方案。例如,10月,Google Cloud和Anthropic进一步加深了合作,后者扩大了对TPU的使用,以提高训练即将推出的Claude模型所需的计算能力。Anthropic表示,这项协议将使其获得大约一百万个TPU,主要是因为这些TPU具有“价格性能和效率”优势。

对此,AWS势必会作出回应。尽管目前没有迹象表明三方不能共存,但随着Trainium3的即将发布,这家超大规模云服务商将重押自身的成本和能效优势,试图超越Google。随着芯片战争一触即发,企业继续寻求AI投资回报,AWS将依赖其广泛的行业联系和长期的基础设施实力,在re:Invent大会上展示其如何结合规模和灵活性。

ITPro将于12月1日至5日在拉斯维加斯现场报道AWS re:Invent大会,您可以通过我们的实时博客、社交媒体渠道和通讯关注所有最新报道。

(以上内容均由Ai生成)

你可能还想读

n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日
台积电:十年先进制程功耗降76%

台积电:十年先进制程功耗降76%

快速阅读: 据台积电披露,其从2018年N7到2028年A14制程十年间功耗降低76%,能效提升4.2倍,并推进N3P制程与HBM4E内存集成,强化AI及高性能计算芯片效能。 台积电日前在2025年OIP生态系统论坛欧洲场披露,从2018年 […]

发布时间:2025年12月8日
美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日