AI

AMD利用RDNA 4核心设计灵活生产多款产品

发布时间:2025年8月28日    来源:szf
AMD利用RDNA 4核心设计灵活生产多款产品

快速阅读: AMD在Hot Chips 2025会议上确认,RDNA 4架构的9000系列显卡可通过非对称收获技术调整性能,生产多种SKU,提高产量和灵活性,降低成本。

AMD 在 Hot Chips 2025 会议上确认,其基于 RDNA 4 架构的 9000 系列显卡在设计阶段或流片后可以调整性能。AMD 展示了如何通过削减 GPU 设计来生产更多 SKU。

所有 GPU 包含大量相似组件,如算术逻辑单元 (ALUs)、缓存、专用硬件单元、控制器和物理层 (PHYs)。因此,如果生产过程中出现缺陷,故障部分可以禁用,处理器仍能正常工作。不过,这并不意味着完全灵活。某些单元之间共享晶体管,其他单元依赖于与邻近组件集成的数据路径。AMD 表示,由于一种称为非对称收获的技术,RDNA 4 的设计比前代产品更加灵活。

通过选择性禁用组件,可以调整内存系统和非对称资源分配。这使 AMD 能够从同一基本设计或同一晶粒中生产高端、中端和专用 GPU。

例如,AMD 通过减少着色器引擎 (SEs)、无限缓存、GDDR6 控制器和 PHYs 的数量,从较大的 Navi 48(Radeon RX 9070 系列)设计中衍生出较小的 Navi 44(Radeon RX 9060 系列),同时保留命令处理器、显示引擎、媒体引擎、安全处理器等特定组件。通过重用 Navi 48 的光罩,AMD 节省了制造成本。此外,AMD 通过禁用某些元件,从完整的 Radeon RX 9070 XT 中生产出 Radeon RX 9070 和 RX 9070 GRE,从而提高产量并实现定价目标。这种方法还缩短了相关 GPU 的上市时间,因为需要流片、验证和生产的独特硅设计较少。

非对称收获策略的核心在于着色器引擎 (SE) 的收获方式。SE 是 GPU 的基本构建块,包含多个工作组处理器 (WGPs)、计算单元 (CUs) 和用于几何、光栅化和渲染的固定功能阶段。在基于 RDNA 4 的产品中,AMD 允许在存在缺陷或需要较低性能目标时禁用整个着色器引擎。此外,AMD 还可以选择性禁用特定的工作组处理器,提供更多的灵活性。

内存收获增加了另一维度的灵活性。RDNA 4 内存子系统包含多个 GDDR6 控制器,通过无限结构和缓存结构连接。每个内存控制器可以单独熔断,这意味着 AMD 可以将有效总线宽度以 64 位为单位减少。

例如,旗舰型号 Radeon RX 9070 XT 包含四个着色器引擎,每个引擎有 64 个计算单元(共 4096 个流处理器,包含 ALUs),以及四个 64 位内存接口。而低端型号 Radeon 9700 GRE 仅有三个 SE,导致 48 个 CUs 和 3072 个 SPs,以及三个 64 位内存阵列,形成 192 位内存接口。

除了整个着色器引擎外,还可以通过选择性禁用着色器引擎内的工作组处理器来实现更小的收获步骤。这种精细控制使 AMD 能够生产具有不同计算单元数的产品,如 56 个 CU 的 Radeon RX 9070。使用这种方法,Radeon RX 9070 使用一定数量的 CUs 而不是整个 SE,但所有内存接口都启用,因此 RX 9070 拥有完整的 256 位内存总线。

非对称收获的概念进一步扩展,通过不同的计算与像素资源比例,确保产品可以根据游戏负载、多媒体任务或计算密集型使用进行定制,而无需重新设计核心架构或晶粒。

例如,Radeon RX 9070 XT 保持完整的 256 位接口和 16GB 内存,而 RX 9070 GRE 则降至 192 位和 12GB。中端型号如 RX 9060 变体进一步缩小至 128 位总线,支持 16GB 或 8GB 内存,具体取决于 SKU。这种颗粒度使 AMD 能够根据内存价格、可用性和市场定位做出响应,同时使用相同的基线硅。

RDNA 4架构在SoC层面集成了全局L2缓存模块、压缩解压硬件以及Infinity Fabric链接(根据负载不同,运行频率在1.5 GHz至2.5 GHz之间),采用模块化设计。这些组件能够处理变化的数据流,无论多少个着色器引擎或内存通道处于激活状态,架构都能维持效率,即使在部分禁用的配置下也是如此。

集中式的压缩技术节省了带宽和功耗,适用于各种工作负载。AMD报告称,这种方法最多可减少25%的Fabric流量,并在某些光栅化场景中提高15%的性能。这种设计确保无论芯片是部分禁用还是完全启用,支持的基础设施都能保持平衡。

安全性和可靠性功能也嵌入到了架构中,这使得上述灵活配置成为可能。通过提供强大的错误处理能力,AMD可以将部分缺陷芯片作为低端产品出售,而不会有任何妥协。

AMD的非对称收获方法在商业上具有重要意义:目前,该公司已经使用两种处理器构建了七款面向桌面PC和推理服务器的产品线,分别是Navi 48和Navi 44。理论上,AMD还可以向笔记本市场推出四款或更多的RDNA 4 GPU,如果它有兴趣在这个市场展开竞争的话。

然而,AMD决定不在高端桌面GPU市场使用其RDNA 4架构。如果开发一款高端的RDNA 4 GPU(增强命令前端和L2缓存,增加四个着色器引擎和两个内存接口),AMD至少可以再增加三款产品,进入一个利润丰厚的市场,而这个市场现在似乎完全由英伟达占据。

尽管如此,非对称收获在制造和营销方面都帮助了AMD。通过在多个层级嵌入收获功能——从着色器引擎和工作组处理器到计算比例和内存通道——AMD最大限度地提高了每片晶圆的产出,根据市场需求生产产品,并在整个产品线中保持一致的功能集。这使得AMD的GPU对公司的盈利能力略有提升,因为它有助于控制成本,增加了可销售的芯片数量。

AMD成功实施非对称收获能力将为其下一代架构UDNA积累宝贵经验。这将如何影响RDNA 5和UDNA 6 GPU,还有待观察。请继续关注。

(以上内容均由Ai生成)

你可能还想读

Coinbase新协议让AI自主完成加密支付

Coinbase新协议让AI自主完成加密支付

快速阅读: Coinbase推出MCP工具,基于x402协议,使AI代理能持有钱包、发送稳定币支付,实现机器间加密货币转账,内置限额和合规检查确保安全。 Coinbase新推出的MCP工具允许人工智能代理持有钱包并发送稳定币支付。基于Coi […]

发布时间:2025年10月24日
硅实验室推出Simplicity Ecosystem,简化物联网开发流程

硅实验室推出Simplicity Ecosystem,简化物联网开发流程

快速阅读: 硅实验室推出Simplicity生态系统,旨在简化嵌入式物联网开发,包括Simplicity Studio 6和2026年推出的Simplicity AI SDK,提供模块化工具和AI辅助设计,支持多种物联网标准。 硅实验室推出 […]

发布时间:2025年10月24日
老旧印刷厂变身高效AI数据中心

老旧印刷厂变身高效AI数据中心

快速阅读: 帕特莫斯利用旧印刷厂的液体设施,支持每机柜50至140千瓦电力需求,采用多环路液体冷却系统,确保高效散热与硬件保护,接入堪萨斯城区域冷水供应,实现环保节能。 他说道:“我认为,棕地是一种极具创意的方法来应对我们当前面临的最大问题 […]

发布时间:2025年10月24日
AI安全集成:Snyk Evo引领企业智能防护新纪元

AI安全集成:Snyk Evo引领企业智能防护新纪元

快速阅读: 数字系统的快速发展要求安全架构更加智能、灵活。Snyk Evo通过自主编排、AI感知和主动保护,重新定义AI应用安全,减少暴露风险,简化开发流程。 数字系统的快速发展迫使安全架构必须更快地思考、更智能地行动并即时适应。随着各组织 […]

发布时间:2025年10月24日
黄仁勋:美光对下一代AI突破至关重要

黄仁勋:美光对下一代AI突破至关重要

快速阅读: 英伟达与美光合作,推动AI基础设施发展。美光HBM3E内存助力英伟达GPU,提升AI性能。黄仁勋称,高性能内存对AI应用至关重要,双方合作开启消费级和企业级AI新水平。 在全球领导层就人工智能可持续发展进行辩论之际,各公司纷纷投 […]

发布时间:2025年10月24日
苹果COO确认休斯顿制造AI服务器提前发货

苹果COO确认休斯顿制造AI服务器提前发货

快速阅读: 苹果首席运营官萨比赫·汗确认,因特朗普总统推动,苹果从休斯顿新工厂提前出货美国制造的人工智能服务器,此举响应总统号召,促进本国就业。 苹果首席运营官萨比赫·汗在接受福克斯新闻网数字版采访时确认,公司正从其位于休斯顿的新工厂提前出 […]

发布时间:2025年10月24日
微软Edge浏览器增强Copilot模式,挑战AI浏览器市场

微软Edge浏览器增强Copilot模式,挑战AI浏览器市场

快速阅读: 微软Edge浏览器推出Copilot模式,提供AI代理功能,包括Actions和Journeys,支持语音操作完成任务及记录浏览历史,帮助用户从中断处继续。 Edge 浏览器推出 Copilot 模式,带来更强大的代理 AI 功 […]

发布时间:2025年10月24日
阿联酋总统重组人工智能与先进技术委员会

阿联酋总统重组人工智能与先进技术委员会

快速阅读: 阿布扎比总统重组人工智能与先进技术委员会,由谢赫·塔农任主席,旨在加速AI政策实施与技术发展,推动《阿布扎比数字政府战略2025-2027》实现。 阿布扎比,10月23日(WAM/ANI):阿布扎比酋长国总统谢赫·穆罕默德·本· […]

发布时间:2025年10月24日