SNIA与OCP携手推进AI存储解决方案,降低能耗
快速阅读: 2025年SNIA存储开发者大会推出Storage.AI倡议,旨在通过减少I/O数据放大、优化数据移动等措施,解决AI数据服务挑战。OCP与SNIA合作推进数据中心存储进展,非易失性内存助力降低能耗。
在2025年SNIA存储开发者大会(SDC)上,讨论了多项新举措,旨在提供更好的数据流以支持人工智能工作流程。开放计算项目(OCP)与SNIA合作,讨论了超大规模数据中心联盟中的存储进展。我的同事吉姆·汉迪讨论了芯片和其他新的半导体封装方法如何能够用非易失性内存替代易失性内存,从而减少人工智能增长的一些能源消耗预测。
SNIA董事会主席J.梅茨在2025年存储开发者大会(SDC)上发表演讲,介绍了SNIA的一项名为storage.AI的倡议,旨在创建专为人工智能设计的存储系统。他指出,这项工作的目标是建立一个供应商中立的、基于开放标准的努力,解决最紧迫的人工智能数据服务挑战,例如内存分级、延迟、数据移动、近数据计算和存储效率。
Storage.AI的目标包括:
– 减少I/O数据放大,优化加速器的I/O消耗;
– 在AI工作负载生命周期中实现高效、安全和可靠的数据移动;
– 为加速器提供新的启动和消费模型;
– 标准化的硬件/软件接口定义;
– 开放编程模型;
– 安全的数据移动和容量。
现有的SNIA标准倡议可能有助于实现Storage.AI,包括智能数据加速接口(SDXI),该接口支持处理器无关的DMA加速和数据转换。计算存储API和架构支持近数据计算,NVM编程模型则提供访问内存层级的统一软件接口。
Swordfish和Redfish扩展支持存储管理,对象驱动工作组提供对象存储的标准接口。灵活的数据放置API支持优化的数据布局和流式吞吐量,当然,安全性保护数据,绿色倡议则提供电源和热解决方案。下图展示了这些现有技术工作组如何支持Storage.AI。
Storage.AI从现有的SNIA技术工作组中受益匪浅。Storage.AI成员对创建技术工作组项目感兴趣,例如,通过RDMA/UE实现文件和对象的混合后端与远程内存访问。加速器CPU旁路将允许在加速器和数据之间移动数据时绕过CPU,而加速器发起的存储I/O将减少CPU瓶颈。
梅茨的演讲中展示了一张图表,显示了Storage.AI对AI工作流程的预期改进。广泛的行业努力正在与Storage.AI合作,包括超以太网联盟(UEC)、NVMe、开放计算平台(OCP)、分布式管理任务组(DMTF)、PCI-SIG、Greengrid和即将加入的UALink。
即将到来的OCP全球峰会将在几周后举行,Meta的罗斯·斯坦福特和微软的李·普雷维特发表了关于OCP存储项目的另一场主题演讲。他们展示了一张最近OCP工作的表格。特别是,OCP为数据中心规格的NVMe SSD的发展做出了贡献。演讲指出了关键功能,用于管理和部署大规模数字存储,包括基于大规模部署的OCP健康信息扩展日志提供遥测指标,OCP延迟监控功能用于大规模隔离、监控和调试延迟峰值。OCP格式化的遥测为人类可读的日志提供客户有用的遥测信息,并提高了安全性,开源的OCP NVMe命令行界面提供了开源工具。
硬件组件日志向客户提供制造信息,设备自检改进提供通用失败段代码,设备自报告功耗测量在大规模部署中更有用。
我的同事吉姆·汉迪在他的《未来处理器芯片》演讲中,重点讨论了芯片在未来半导体封装中的角色,以及芯片和未来的堆叠芯片封装将如何启用新的非易失性内存。这一点非常重要,因为像DRAM这样的易失性内存是数据中心能源消耗的一个重要贡献者。以下是减少数据中心能源消耗的一些方法。
在2025年的SNIA SDC上,不仅有关于Storage.AI改善AI工作负载数据流的讨论,还有OCP存储倡议的介绍。非易失性内存提供了减少AI能耗的方法。
(以上内容均由Ai生成)