英特尔Gaudi 2E加速DeepSeek V3.1,问答编码显著提升
快速阅读: 英特尔推出Gaudi 2E AI加速器,采用7纳米制程,配备96GB HBM2E内存和48MB SRAM,总内存带宽2.4TB,优化随机和线性访问,提升DeepSeek-V3.1问答和编码能力。
英特尔宣布,Gaudi 2E AI 加速器现已为 DeepSeek-V3.1 提供深度优化支持。这款加速器采用 7 纳米制程,配备 96GB HBM2E 内存和 48MB SRAM,总内存带宽达到 2.4TB。Gaudi 2E 针对随机访问和线性访问场景进行了优化,有效避免了 AI 训练或推理任务的延迟。
Gaudi 2E 拥有 24 个完全可编程的张量处理器核心(TPC)和 2 个矩阵乘法引擎(MME),具备出色的可扩展能力,提供 24 个 100 GbE 端口,支持多卡互联,为用户提供了灵活且可定制的解决方案,满足不断变化的 AI 需求。
实测数据显示,在 Gaudi 2E 的支持下,DeepSeek-V3.1 在问答和编码方面的能力显著提升。在部署了 8 张 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型时,当输入/输出 token 长度均为 1k、多用户并发数为 30 时,每个并发 token 生成速率达到每秒 10 token;当输入/输出 token 长度均为 2k、多用户并发数为 28 时,每个并发 token 生成速率同样达到每秒 10 token。
(以上内容均由Ai生成)