AMD利用RDNA 4核心设计灵活生产多款产品
快速阅读: AMD在Hot Chips 2025会议上确认,RDNA 4架构的9000系列显卡可通过非对称收获技术调整性能,生产多种SKU,提高产量和灵活性,降低成本。
AMD 在 Hot Chips 2025 会议上确认,其基于 RDNA 4 架构的 9000 系列显卡在设计阶段或流片后可以调整性能。AMD 展示了如何通过削减 GPU 设计来生产更多 SKU。
所有 GPU 包含大量相似组件,如算术逻辑单元 (ALUs)、缓存、专用硬件单元、控制器和物理层 (PHYs)。因此,如果生产过程中出现缺陷,故障部分可以禁用,处理器仍能正常工作。不过,这并不意味着完全灵活。某些单元之间共享晶体管,其他单元依赖于与邻近组件集成的数据路径。AMD 表示,由于一种称为非对称收获的技术,RDNA 4 的设计比前代产品更加灵活。
通过选择性禁用组件,可以调整内存系统和非对称资源分配。这使 AMD 能够从同一基本设计或同一晶粒中生产高端、中端和专用 GPU。
例如,AMD 通过减少着色器引擎 (SEs)、无限缓存、GDDR6 控制器和 PHYs 的数量,从较大的 Navi 48(Radeon RX 9070 系列)设计中衍生出较小的 Navi 44(Radeon RX 9060 系列),同时保留命令处理器、显示引擎、媒体引擎、安全处理器等特定组件。通过重用 Navi 48 的光罩,AMD 节省了制造成本。此外,AMD 通过禁用某些元件,从完整的 Radeon RX 9070 XT 中生产出 Radeon RX 9070 和 RX 9070 GRE,从而提高产量并实现定价目标。这种方法还缩短了相关 GPU 的上市时间,因为需要流片、验证和生产的独特硅设计较少。
非对称收获策略的核心在于着色器引擎 (SE) 的收获方式。SE 是 GPU 的基本构建块,包含多个工作组处理器 (WGPs)、计算单元 (CUs) 和用于几何、光栅化和渲染的固定功能阶段。在基于 RDNA 4 的产品中,AMD 允许在存在缺陷或需要较低性能目标时禁用整个着色器引擎。此外,AMD 还可以选择性禁用特定的工作组处理器,提供更多的灵活性。
内存收获增加了另一维度的灵活性。RDNA 4 内存子系统包含多个 GDDR6 控制器,通过无限结构和缓存结构连接。每个内存控制器可以单独熔断,这意味着 AMD 可以将有效总线宽度以 64 位为单位减少。
例如,旗舰型号 Radeon RX 9070 XT 包含四个着色器引擎,每个引擎有 64 个计算单元(共 4096 个流处理器,包含 ALUs),以及四个 64 位内存接口。而低端型号 Radeon 9700 GRE 仅有三个 SE,导致 48 个 CUs 和 3072 个 SPs,以及三个 64 位内存阵列,形成 192 位内存接口。
除了整个着色器引擎外,还可以通过选择性禁用着色器引擎内的工作组处理器来实现更小的收获步骤。这种精细控制使 AMD 能够生产具有不同计算单元数的产品,如 56 个 CU 的 Radeon RX 9070。使用这种方法,Radeon RX 9070 使用一定数量的 CUs 而不是整个 SE,但所有内存接口都启用,因此 RX 9070 拥有完整的 256 位内存总线。
非对称收获的概念进一步扩展,通过不同的计算与像素资源比例,确保产品可以根据游戏负载、多媒体任务或计算密集型使用进行定制,而无需重新设计核心架构或晶粒。
例如,Radeon RX 9070 XT 保持完整的 256 位接口和 16GB 内存,而 RX 9070 GRE 则降至 192 位和 12GB。中端型号如 RX 9060 变体进一步缩小至 128 位总线,支持 16GB 或 8GB 内存,具体取决于 SKU。这种颗粒度使 AMD 能够根据内存价格、可用性和市场定位做出响应,同时使用相同的基线硅。
RDNA 4架构在SoC层面集成了全局L2缓存模块、压缩解压硬件以及Infinity Fabric链接(根据负载不同,运行频率在1.5 GHz至2.5 GHz之间),采用模块化设计。这些组件能够处理变化的数据流,无论多少个着色器引擎或内存通道处于激活状态,架构都能维持效率,即使在部分禁用的配置下也是如此。
集中式的压缩技术节省了带宽和功耗,适用于各种工作负载。AMD报告称,这种方法最多可减少25%的Fabric流量,并在某些光栅化场景中提高15%的性能。这种设计确保无论芯片是部分禁用还是完全启用,支持的基础设施都能保持平衡。
安全性和可靠性功能也嵌入到了架构中,这使得上述灵活配置成为可能。通过提供强大的错误处理能力,AMD可以将部分缺陷芯片作为低端产品出售,而不会有任何妥协。
AMD的非对称收获方法在商业上具有重要意义:目前,该公司已经使用两种处理器构建了七款面向桌面PC和推理服务器的产品线,分别是Navi 48和Navi 44。理论上,AMD还可以向笔记本市场推出四款或更多的RDNA 4 GPU,如果它有兴趣在这个市场展开竞争的话。
然而,AMD决定不在高端桌面GPU市场使用其RDNA 4架构。如果开发一款高端的RDNA 4 GPU(增强命令前端和L2缓存,增加四个着色器引擎和两个内存接口),AMD至少可以再增加三款产品,进入一个利润丰厚的市场,而这个市场现在似乎完全由英伟达占据。
尽管如此,非对称收获在制造和营销方面都帮助了AMD。通过在多个层级嵌入收获功能——从着色器引擎和工作组处理器到计算比例和内存通道——AMD最大限度地提高了每片晶圆的产出,根据市场需求生产产品,并在整个产品线中保持一致的功能集。这使得AMD的GPU对公司的盈利能力略有提升,因为它有助于控制成本,增加了可销售的芯片数量。
AMD成功实施非对称收获能力将为其下一代架构UDNA积累宝贵经验。这将如何影响RDNA 5和UDNA 6 GPU,还有待观察。请继续关注。
(以上内容均由Ai生成)