AMD RX 9070 AI 性能基准审查 vs 9070 Xt、7800 Xt、Nvidia RTX 5070、4070
快速阅读: 《Neowin.net》消息,评测显示,AMD RX 9070显卡在AI性能上表现出色,尤其适合需要大显存的任务,得分为9/10。尽管在FP16精度上略逊于Nvidia,但其性价比和能效仍具吸引力。适合预算约550美元且需兼顾游戏与生产力的用户。
本月早些时候,我们分享了对AMD全新RX 9070显卡评测的第一部分,聚焦于其游戏性能,最终我们为其打出了7.5分(满分10分)。相较之下,RX 9070 XT则荣获满分10分。非XT版本得分较低的主要原因在于其价格相较于XT版本偏高,导致性价比稍逊。我们认为两者的差价并不大,尽管RX 9070在能效方面略胜一筹,但在桌面游戏显卡领域,性能与价值往往比能效更为关键。不过,对于生产力需求来说,情况可能有所不同,因为节能也是考量的重要因素之一。因此,类似于我们为XT版本所做的那样,我们也针对RX 9070展开了专门的生产力评测,将其与9070 XT、7800 XT以及Nvidia的5070和4070进行了对比。AI性能作为当今世界极为重要的衡量标准,AMD也承诺其底层架构的改进将带来显著提升。我们已经通过XT版本亲身体验到了显著的进步,现在是时候来看看非XT版本在此方面的表现了。
在评测开始之前,这是Sayan Sen(作者)与Steven Parker之间的合作,后者为我们提供了测试用的PC。提到测试PC,以下是其具体配置:
– 机箱:酷冷至尊MasterBox NR200P MAX
– 主板:华擎Z790 PG-ITX/TB4
– CPU:英特尔酷睿i7-14700K 搭配Thermal Grizzly导热垫
– 内存:T-FORCE Delta RGB DDR5(2x16GB)7600MT/s CL36(XMP配置文件)
– 硬盘:2TB金士顿Fury Renegade SSD
– 操作系统:Windows 11 24H2(构建版本26100.3194)
– 驱动程序:AMD Adrenaline v24.30.31.03 / 25.3.1 RC(由AMD提供的测试驱动);Nvidia GeForce v572.47
– 测试显卡:蓝宝石Pulse 9070 XT、Nvidia 5070 FE、Pulse 9070
首先,我们在ONNX上运行Geekbench AI。在量化和FP32(单精度)性能方面,RTX 5070被9070 XT和9070击败。同样地,4070在FP16(半精度)性能上接近9070,但后者在量化分数上快了30%,在FP32(单精度)上几乎快了12.2%。造成这种差异的原因是每张显卡的可用显存容量不同。Nvidia显卡各自配备了12GB显存,因此仅在FP16精度测试中表现更优,因为其他测试更依赖显存。
接下来,我们转向UL Procyon套件,首先是从图像生成基准开始。我们选择了Stable Diffusion XL FP16测试,因为这是Procyon套件中最繁重的工作负载。与我们在Geekbench AI中看到的情况类似,Nvidia显卡在这里表现得相对较好,因为它使用的是FP16或半精度,这意味着使用的显存较少。所以请记住这一点,如果你希望处理float32 AI工作负载,那么拥有大于12GB缓冲区的显卡很可能会成为赢家。RX 9070相比7800 XT有显著提升,我们观察到约54%的增长。这一提升归功于核心架构本身的优化,因为两张卡的显存容量都是16GB。
接着图像生成后,我们转向文本生成基准测试。在这个工作负载中,9070相比7800 XT的性能提升是最不令人印象深刻的,前者在此处快了约7.25%。在Phi和Mistral模型中,9070的表现不及Nvidia 4070,尽管它在两个Llama测试中表现更好。另一个奇怪的结果是,在Llama 2测试中,5070的表现逊色于所有显卡,包括7800 XT。我们每个测试都运行了三次,并取了最佳成绩,但我们对此尚不确定。
完成AI测试后,我们在Geekbench计算基准中测量了OpenCL吞吐量。RX 9070在此处表现欠佳,甚至落后于7800 XT,且明显慢于其他三张卡。有趣的是,即使RTX 5070在OpenCL上也无法超越4070,这可能表明此次AMD和Nvidia并未将OpenCL优化作为重点。这也可能是Geekbench本身的问题。
**结论**
我们感到相当满意,但也有些许遗憾。显然,9070以及9070 XT在推理精度更高时表现尤为出色,这是由于它们相比Nvidia 5070拥有更大的显存缓冲区。但在FP16方面,Nvidia显卡则领先。尽管如此,RNDA 4,包括RX 9070,相比RDNA 3(7800 XT)仍有大幅增长。正如我们在图像生成基准中所注意到的那样,这是一个高强度负载,增长率超过50%。
那么我们应该如何看待RX 9070作为生产力硬件呢?我们认为它是一张不错的显卡。如果有人正在寻找一款价格约为550美元的显卡,既能玩游戏又能处理一些AI任务,那么这款显卡是一个不错的选择,尤其是当你处理单精度任务或其他需要大显存的任务时。而且我们已经知道它效率很高,这也是一个优势。然而,对于那些寻求能够应对更多需求的显卡的用户,AMD最近推出了Radeon AI PRO R9700,本质上是9070 XT的32GB升级版,并加入了一些工作站优化。
综合考虑,我们给AMD的RX 9070在AI性能方面的评分是9分(满分10分)。对于那些关注生产力的用户来说,价格因素不像那些考虑显卡用于游戏的人那么重要,因此我们认为整体表现相当不错,尤其是在你需要超过12GB显存的情况下尤其有用。
购买链接:
– RX 9070 / XT(美国亚马逊)
作为亚马逊会员,我们因合格购买而获得收益。
(以上内容均由Ai生成)