AI

Kioxia发布5TB高速闪存模块,助力AI GPU性能提升

发布时间:2025年8月24日    来源:szf
Kioxia发布5TB高速闪存模块,助力AI GPU性能提升

快速阅读: 铠侠开发5TB高带宽闪存模块,带宽达64GB/s,专为GPU设计,比HBM容量大8-16倍,功耗低,适合AI数据中心,未来存储模块或与GPU竞争带宽优势。

铠侠开发了一款5TB高带宽闪存模块原型,带宽达到64GB/s。这款基于NAND的内存主要用于GPU。与HBM相比,高带宽闪存(HBF)将概念应用于NAND闪存,容量是基于DRAM的HBM的8-16倍。通过结合速度和持久存储,HBF能够高效访问大型AI数据集,同时降低功耗。铠侠将这款HBF模块的带宽提升至64GB/s,实现了这一能力。

通常提到“闪存存储”时,人们首先想到的是容量,其次是速度。即使是最新的PCIe 5.0 SSD——如三星9100 Pro,其速度也仅为14GB/s,远不能满足现代GPU和CPU的带宽需求。铠侠的新原型颠覆了这一预期:单个闪存模块提供5TB容量和64GB/s的持续带宽,采用PCIe 6.0接口。这相当于目前最快的PCIe 5.0驱动器的四倍以上,并接近HBM2E每堆栈的吞吐量。

关键在于系统的扩展方式;不同于传统的单个中央控制器管理整个NAND阵列——随着更多芯片和通道的增加,这种方式很快成为瓶颈——铠侠为每个模块配备了独立的控制器。这些控制器紧邻NAND芯片,以菊花链形式连接。这样可以减少串扰,消除宽并行总线的复杂性,后者在速度提高时变得越来越难以管理。相反,数据以串行方式传递,每个链接使用PAM4信号传输128Gbps。

PAM4(脉冲幅度调制四级)将每个符号的数据速率提高一倍,但对噪声和位错误更为敏感。为了保持信号完整性,铠侠采用了均衡、纠错和更强的预加重技术——类似于PCIe 6.0本身的要求。这也解释了为何选择PCIe 6.0作为主机接口,因为16条PCIe 6.0通道理论上可以处理约128GB/s的双向数据。铠侠的目标是64GB/s,略低于该极限的一半,留有足够的余地用于纠错和开销,而不会使总线饱和。

正如预期的那样,延迟是主要权衡点。HBM内存的工作时间以数百纳秒计,几乎像是GPU寄存器的扩展。即使使用高级控制器,NAND闪存的访问时间仍以数十微秒计,相差几个数量级。铠侠通过积极预取和控制器级别的缓存来缓解这一问题,因此顺序工作负载受影响较小。虽然NAND无法像DRAM一样快速,但这种差距缩小到足以使流数据集、AI检查点或大规模图分析中带宽比原始延迟更重要的程度。

另一个关键因素是功耗。铠侠声称每个模块的功耗低于40W,与传统Gen5 SSD相比,后者在14GB/s的速度下功耗可达15W。从每GB/s的功耗来看,这个模块的效率大幅提升。这一点非常重要,因为在超大规模机架中,几百个驱动器很容易消耗数千瓦的功率。AI数据中心由于H100集群的使用,其功耗预算已经大幅增加,因此在存储层节省每一瓦都至关重要。

这些模块还带来了新的系统设计选项。由于控制器以菊花链形式连接,增加更多模块不会消耗额外带宽,性能随容量线性扩展。一组完整的16个模块可以达到80TB的闪存和超过1TB/s的吞吐量——这些数字曾仅限于并行文件系统或DRAM暂存区。这使得存储可以像近内存一样直接位于PCIe架构上,与加速器并行,而不是困在后端I/O中。

这并不是铠侠首次涉足高带宽闪存领域。该公司一直在试验长距离PCIe SSD和GPU对等闪存链接,包括与英伟达合作研究XL-Flash驱动器,旨在实现1000万IOPS。结合其在日本宣布的工厂扩建计划——预计到2028年闪存需求将几乎翻三倍——显然,这款原型不仅仅是单一产品。它预示着NAND不仅会更大,还会更快,快到足以靠近计算堆栈。

目前,该模块仍处于原型阶段,存在一些未解问题:如何处理混合随机工作负载、ECC扩展如何影响延迟以及在AI训练条件下实际吞吐量的表现。然而,更重要的是,闪存正突破其作为慢速深层存储的角色,向存储层次结构的更高位置迈进。如果铠侠的愿景得以实现,下一代数据中心的存储模块可能会与GPU争夺带宽优势。

(以上内容均由Ai生成)

你可能还想读

英国Lodestar获资推进AI卫星感知系统

英国Lodestar获资推进AI卫星感知系统

快速阅读: 据英国航天局消息,该局通过SECP计划向洛德斯塔空间公司提供3万英镑资助,用于提升其“米斯里尔”在轨感知系统的激光雷达精度,支持2026年飞行演示,强化英国在自主空间操作领域的竞争力。 英国航天局近日通过其“空间生态系统商业化计 […]

发布时间:2025年12月8日
软银收购DigitalBridge加码AI算力布局

软银收购DigitalBridge加码AI算力布局

快速阅读: 据彭博社报道,美国数字桥公司加速布局亚太数字基建,整合通信塔与数据中心资源,以满足AI算力激增带来的低延迟、高带宽需求,强化其全球基础设施地位。 近日,美国数字桥公司(DigitalBridge)在拓展亚洲数字基础设施布局方面动 […]

发布时间:2025年12月8日
贝莱德:AI投资将驱动美国经济韧性增长

贝莱德:AI投资将驱动美国经济韧性增长

快速阅读: 据贝莱德发布消息称,美国经济正迈入由大规模人工智能投资驱动的资本密集型阶段,预计2030年全球AI相关资本支出将达5至8万亿美元,重塑产业格局并影响供应链与劳动力市场。 日前,全球知名资产管理公司贝莱德在其最新发布的全球经济展望 […]

发布时间:2025年12月8日
硅谷预言:AI将重塑工作与收入

硅谷预言:AI将重塑工作与收入

快速阅读: 据最新消息,人工智能加速冲击全球就业结构,部分职业或将消失,肯尼亚试点全民基本收入项目引发隐私争议,国际社会呼吁构建适应AI时代的社会保障政策框架。 近日,人工智能技术加速渗透全球多个行业,引发对就业结构和收入模式的广泛关注。多 […]

发布时间:2025年12月8日
AI重塑广告业:从执行到智能协同

AI重塑广告业:从执行到智能协同

快速阅读: 据最新消息,广告传播机构加速转型为智能协同伙伴,依托AI优化创意系统,融合算法效率与人文共情,构建“智能+共情”双轮驱动战略,提升传播精准度与内容温度。 人工智能正加速从实验室走向实际应用,其价值日益体现在广告、媒体等行业的日常 […]

发布时间:2025年12月8日
AI推动数据分析普及,渠道伙伴机遇扩大

AI推动数据分析普及,渠道伙伴机遇扩大

快速阅读: 据最新消息,Tableau首席产品官指出AI正推动数据分析进入新阶段,聚焦对话式分析、实时洞察与语义层技术三大方向,2025年成AI应用部署关键年。 日前,数据分析企业Tableau首席产品官索南德·琼斯表示,随着人工智能技术加 […]

发布时间:2025年12月8日
欧盟报告:AI训练应借鉴Napster版权教训

欧盟报告:AI训练应借鉴Napster版权教训

快速阅读: 欧洲议会法律事务委员会发布报告,主张通过强制性法定许可制度解决AI训练数据版权争议,允许使用公开作品并支付统一版税,以平衡创新激励与权利人补偿,避免“选择退出”机制导致模型偏见。 日前,欧洲议会法律事务委员会发布题为《版权与人工 […]

发布时间:2025年12月8日
特朗普推AI新政,各州监管加速推进

特朗普推AI新政,各州监管加速推进

快速阅读: 据最新消息,美国科罗拉多、加州和纽约等州加速推进AI监管立法,分别聚焦算法歧视、高风险系统披露及自动化决策监管,但行业担忧各州标准不一或阻碍全国AI产业发展。 近日,美国多个州加快人工智能监管立法步伐,以应对算法偏见、数据隐私及 […]

发布时间:2025年12月8日