CoreWeave推出专为AI优化的高速对象存储

发布时间:2025年10月23日    来源:szf
CoreWeave推出专为AI优化的高速对象存储

快速阅读: CoreWeave推出专为AI工作负载优化的对象存储,解决GPU驱动任务中数据移动瓶颈,提高数据访问速度和效率,支持大规模模型训练,减少成本和操作复杂性。

在部署人工智能工作负载时,随着对数据需求量大的模型的压力增大,存储架构中的一个日益突出的弱点被暴露出来。CoreWeave的AI对象存储直接应对了这一挑战,旨在解决GPU驱动工作负载中数据移动的持续瓶颈问题。与提供带有AI概念的一般云存储不同,CoreWeave提供了一种专为无缝访问、速度和灵活性设计的存储解决方案,其根本目的是使数据像现代AI工作流程所要求的那样具有动态性。

新的存储平台将影响大型组织如何训练、微调和部署AI模型。通过优先考虑吞吐量和全球数据可用性,CoreWeave旨在充分利用宝贵的GPU资源,减少浪费的时间和基础设施开支。对于引领AI创新的企业来说,这种转变不仅提高了技术效率,还促进了分布式团队和云区域之间的合作和扩展新方法。

CoreWeave的推出正值企业面临数据集庞大、出口成本上升以及跨多个环境管理AI管道的操作复杂性之时。无论模型和团队在哪里操作,解除数据阻塞的需求已经从技术好奇心转变为战略必要性。

CoreWeave的AI对象存储是完全托管的,并且从头开始设计,专门用于GPU密集型AI任务。该系统围绕分离计算和存储的分布式架构构建,能够实现大规模的超低延迟数据访问。这个平台的特点在于它集成了本地对象传输加速器(LOTA),这是一种专有技术,可以将每个GPU节点转变为本地缓存端点。当需要数据时,LOTA会将其移近GPU,无论数据位于哪个区域或云端,从而减少访问时间并最小化数据复制。

据报道,该存储系统的吞吐量可达到每GPU高达7GB/s,当扩展到数十万GPU时,它可以支持当今最大的模型训练管道之一。工程师不需要构建或管理自定义缓存解决方案;LOTA的AI专用预取和缓存功能直接嵌入存储层。这使得模型检查点、大数据集甚至媒体资产能够在计算资源之间快速移动,而不会引入操作摩擦或产生额外的传输成本。

从功能角度来看,CoreWeave AI对象存储保持S3兼容性,适用于API和工具,与已建立的框架如Weights & Biases集成,用于AI研究中的实验跟踪和工件管理。安全方面,数据在静止和传输过程中均加密,具备强大的访问策略、SAML和SSO集成,以及通过Prometheus和Grafana仪表板进行实时监控。

实际应用的一个例子是在多地区AI团队合作训练大型语言模型时。团队无需在地理上复制数据集并支付每次数据出口交易的费用,而是使用CoreWeave的存储作为单一的数据源。在他们进行实验和迭代时,模型检查点可以高速读取和写入,保持GPU的繁忙状态并缩短总的训练周期。

在对象存储市场中,存在诸如亚马逊S3、谷歌云存储和微软Azure Blob存储等成熟的巨头,它们大多提供针对通用用途的S3兼容服务。CoreWeave与众不同之处在于它专注于优化AI工作负载。它不是改造现有的基础设施,而是专门为高吞吐量、多云GPU集群的独特需求定制的存储。

这种定制的方法体现在与平台如Weights & Biases的集成上,后者最近被CoreWeave收购,以实现快速的工件存储和检索。许多现代MLOps工作流,包括分布式训练和模型微调,都受益于多个团队能够访问相同的数据,无论他们在何处运行作业,无需在云或区域之间移动大量文件。

然而,挑战仍然存在。由于CoreWeave AI对象存储首先针对AI和高性能GPU环境进行了优化,因此需要强一致性保证或遗留应用程序模式的工作负载可能面临适应障碍。此外,虽然CoreWeave的价格消除了出口和请求费用,但对于持续进行大规模AI操作的组织而言,总成本优势最为显著。小型部署或混合工作负载环境可能看到的成本改善不如头条新闻所声称的那么明显。

CoreWeave AI对象存储重塑了数据与计算之间的关系,专为人工智能驱动的企业设计。其技术架构注重吞吐量、全球可访问性和大规模扩展,直接针对传统云存储中存在的速度慢和效率低的问题。在需要高速度、大容量数据访问且团队分散操作的环境中,这些优势尤为明显。

然而,成功采用该技术还需对集成复杂性、迁移成本及现有工作流程的具体情况进行坦诚评估。对于具有前瞻性的组织而言,CoreWeave的存储解决方案不仅能够加速模型开发,还能促进新的合作模式和创新,这些在过去是难以实现的。随着人工智能竞赛的加剧,决策者需要权衡技术能力、运营风险和成本的可预测性,通过实际试点和具体的成本建模来辅助决策过程。

AI存储的未来充满竞争与活力。CoreWeave的专业化产品明确表明,通用对象存储的时代可能即将结束,取而代之的是为AI快速发展和大规模应用而设计的平台。

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日