Cerebras 推出 Qwen 3-32B，这是一款专为智能高速推理而构建的开放重量级 LLM 模型

发布时间：2025年5月20日来源：szf

快速阅读: 《硅角度》消息，Cerebras Systems推出Qwen3-32B，一款高速且智能的开源大语言模型，性能远超竞品。公司创始人费尔德曼强调推理模型的重要性，并透露与IBM、Meta的合作，为全球顶级机构提供高效AI服务。

随着人工智能应用场景的不断扩展，先进的人工智能性能变得愈发关键。高性能的AI系统在解决复杂问题、辅助人类决策以及有效应对动态现实世界方面发挥着至关重要的作用。基于此需求，Cerebras Systems Inc. 最近推出了Qwen3-32B，这是由创始人兼首席执行官安德鲁·费尔德曼（Andrew Feldman）发布的一款前沿开源大型语言模型。该模型具备复杂的推理能力和实时响应能力，在速度与性能上无人能及。

在Cerebras Supernova活动期间，安德鲁·费尔德曼与SiliconANGLE Media旗下的直播工作室theCUBE进行了独家广播，深入探讨了高性能AI的重要性。“我们正在推出一款全新模型，Qwen 3-32B，和我们所有的模型一样，它在业内是最快速的，”费尔德曼表示，“相比最快的GPU方案，它的速度要快20至30倍。Qwen是一款非常有趣的模型，它是一个推理模型，同时也是当前最聪明的模型之一。尽管它是开源模型，但其表现可以媲美领先的闭源模型。因此，这是一款既快速又智能的模型。我认为它会给一些开源AI模型带来真正的挑战。”

费尔德曼还详细阐述了推理模型对AI性能的关键性影响。推理模型能够使系统超越简单的模式识别，实现逻辑化与情境感知的决策制定，从而提升模型的认知能力，展现出更智能的行为，正如Qwen 3-32B所展现的那样。“推理模型的行为更像人类，”他说，“如果你打算写一篇论文，你不会直接写出整篇论文。你不会仅仅思考一秒就写完整篇论文。很可能你会先生成一个答案，审阅并优化它，再重新思考，最后审查并迭代。推理模型执行的就是这个工作流程。它们会生成答案，审阅并优化它，这就需要更多的工作。”

通过提供专用的AI硬件解决方案，提升性能与效率，Cerebras继续为客户提供量身定制的解决方案。据费尔德曼透露，这就是Cerebras与IBM及Meta平台合作的原因。“Meta宣布将提供API服务，”他说，“用户可以通过其API访问Llama 4，而该API背后依托的是Cerebras。这是Cerebras首个超大规模客户案例。紧随其后，IBM宣布也将采取类似举措。我们将为他们的客户提供快速推理服务。我们已通过IBM将业务拓展至全球最大的金融机构。”

以下是完整的视频采访，这是SiliconANGLE和theCUBE对Cerebras Supernova活动报道的一部分：

**照片来源：SiliconANGLE**

来自SiliconANGLE联合创始人约翰·弗瑞尔的一条消息：

> 您的支持对我们意义重大，使我们得以保持内容免费。只需一键即可支持我们提供免费、深度且相关的内容使命。加入包含超过15,000名#CubeAlumni专家的社群。加入包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·基辛格等众多名人和专家的社区。

“theCUBE是行业的重要合作伙伴。你们确实是我们的活动的一部分，我们非常感谢你们的到来，我知道人们也欣赏你们创造的内容。”
——安迪·贾西

—

**精美排版：**
标题字体加粗，段落分明，确保阅读流畅。

(以上内容均由Ai生成)