AMD、高通宣布支持gpt-oss系列开放模型
快速阅读: 近日,AMD与高通宣布支持OpenAI的gpt-oss系列模型,推动边缘计算与AI结合。AMD的锐龙AI Max+395处理器可运行gpt-oss-120b,每秒输出30个Token;高通骁龙平台则支持gpt-oss-20b,展现强大推理能力。
近日,AMD 与高通宣布,旗下硬件正式支持 OpenAI 推出的 gpt-oss 系列开放推理模型,标志着边缘计算与 AI 结合迈出重要一步。OpenAI 发布的 gpt-oss 系列包括两个模型:参数较少的 gpt-oss-20b 和更复杂的 gpt-oss-120b。gpt-oss-20b 可以在配备 16GB 内存的设备上流畅运行,而 gpt-oss-120b 则能在单个 80GB 显卡上高效执行。
AMD 宣布,锐龙 AI Max+395 处理器成为首款能运行 gpt-oss-120b 模型的消费级 AI PC 处理器。为了适应这一强大模型,AMD 采用 GGML 框架和 MXFP4 格式,使 gpt-oss-120b 在使用约 61GB 显存时得以顺畅运行。此外,“Strix Halo” 平台通过 128GB 统一内存,可将 96GB 分配给 GPU,满足运行需求。
在性能方面,锐龙 AI Max+395 在运行 gpt-oss-120b 时可实现每秒 30 个 Token 的输出速度,并支持 MCP 模型上下文协议。这意味用户在处理复杂任务时可以享受更快的响应速度和更高的效率。
高通表示,经过早期测试,gpt-oss-20b 模型在其骁龙平台上展现出色的思维链推理能力。开发者可通过 Hugging Face 和 Ollama 等知名平台,在搭载骁龙芯片的设备上轻松访问这一模型,充分发挥其强大功能。
此次合作不仅展示了 AMD 与高通在 AI 领域的前瞻性视野,也为边缘计算和人工智能的未来发展铺平了道路。随着 gpt-oss 模型的广泛应用,我们可以期待更加智能化的设备和更灵活的 AI 应用场景。
(以上内容均由Ai生成)