英特尔Gaudi 2E加速DeepSeek V3.1，提升问答编码能力

发布时间：2025年8月27日来源：szf

快速阅读: 英特尔推出7nm Gaudi 2E AI加速器，优化DeepSeek-V3.1性能，支持24个100 GbE端口，多用户并发token生成速率每秒达10 token，提升问答和编码能力。

英特尔今日宣布，Gaudi 2E AI 加速器现已为 DeepSeek-V3.1 提供深度优化支持。这款加速器采用 7nm 制程，配备 96GB HBM2E 内存和 48MB SRAM，总内存带宽达到 2.4TB。英特尔针对随机访问和线性访问场景对 Gaudi 2E 进行了深度优化，有效避免了 AI 训练或推理任务的延迟。

Gaudi 2E 拥有 24 个完全可编程的张量处理器核心和 2 个矩阵乘法引擎，具备卓越的可扩展能力，并提供 24 个 100 GbE 端口，支持多卡互联，为用户提供灵活且可定制的解决方案，以满足不断变化的 AI 需求。

实际测试显示，在 Gaudi 2E 的支持下，DeepSeek-V3.1 在问答和编码方面的能力显著提升。在部署了 8 张 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型时，当输入/输出 token 长度均为 1k、多用户并发数为 30 时，每个并发 token 生成速率达到每秒 10 token；当输入/输出 token 长度均为 2k、多用户并发数为 28 时，每个并发 token 生成速率为每秒 10 token。

(以上内容均由Ai生成)