阿里巴巴最新的 AI 模型击败 OpenAI 的 o1-mini,与 DeepSeek R1 相当
快速阅读: 《解密》消息,阿里云发布了新的推理型AI模型QwQ-32B,使用325亿参数,性能可媲美拥有6710亿参数的深搜r1。该模型基于阿里巴巴的Qwen2.5-32B基础模型,强调了强化学习在提升模型性能方面的有效性。QwQ-32B作为开源软件在Apache 2.0许可证下提供,但也存在一些局限性。阿里巴巴认为这是迈向通用人工智能(AGI)的重要一步。
解密艺术、时尚与娱乐中心。探索场景。阿里云发布了一款新的推理型AI模型,尽管规模远小于竞争对手,但其性能却能与之匹敌。中国科技巨头的云计算部门最新推出的这款产品挑战了“越大越好”的传统观念。该模型名为QwQ-32B,基于阿里巴巴的Qwen2.5-32B基础模型构建,使用了325亿个参数,性能可与拥有6710亿参数的深搜r1相媲美。这一大卫对抗歌利亚式的成就引起了全球AI研究人员和开发者的广泛关注。
“这一显著成果证明了强化学习在应用于预训练于广泛世界知识的强大基础模型时的有效性,”阿里巴巴Qwen团队今天在其公告博客中表示。“我们发现强化学习训练能够持续提升性能,尤其是在数学和编程方面。我们还观察到,持续的强化学习扩展有助于中等规模的模型在性能上与巨型MoE模型竞争。”
AI社区对此反响热烈。“绝对喜欢它!”数据科学家兼AI研究员瓦伊巴夫·斯里瓦斯塔瓦评论道,而哈金空间的首席技术官朱利安·肖蒙则表示该模型“颠覆了传统”。
当然,还有一些有趣的梗图。此外,奥拉玛和格罗宣布已支持该模型,这意味着用户现在可以在第三方应用中编程开源代理并使用此模型,同时借助格罗的基础设施实现前所未有的推理速度。这种效率提升标志着行业的潜在转变,以往的趋势一直是追求更大的模型。
QwQ-32B也有其局限性。它有时会遇到语言混合的问题,并且可能会陷入影响效率的递归推理循环。此外,与其他中国AI模型一样,它符合当地监管要求,可能限制对政治敏感话题的回应,并且上下文窗口有限,为32K令牌。
开源
与其他美国和西方国家的先进AI系统不同,这些系统通常处于付费墙后,QwQ-32B作为开源软件在Apache 2.0许可证下提供。此次发布紧随阿里巴巴一月份发布的Qwen 2.5-Max之后,该公司声称Qwen 2.5-Max在几乎所有方面都优于竞争对手。那次较早的发布正值中国农历新年庆祝期间,凸显了中国科技公司在快速发展的AI领域所面临的竞争压力。
中国模型在AI行业发展中的影响力如此之大,以至于前总统唐纳德·特朗普曾将它们的表现描述为硅谷的“警钟”,但他认为它们是“机遇而非威胁”。当深搜R1发布时,引发了股市的显著下跌,但QwQ-32B并未对投资者产生类似影响。纳斯达克整体下跌,主要是因为政治因素,而非阿里巴巴的影响所致。
不过,阿里巴巴仍将此次发布视为一个起点。“这标志着Qwen在增强推理能力方面迈出的第一步,”公司在博客中表示。“我们相信,结合更强大的基础模型与由大规模计算资源驱动的强化学习,将使我们更接近实现通用人工智能(AGI)。”
编辑:智能通讯:每周由生成式AI模型Gen讲述的AI旅程。请输入您的电子邮箱订阅!
(以上内容均由Ai生成)