阿里巴巴最新的 AI 模型击败 OpenAI 的 o1-mini,与 DeepSeek R1 相当

发布时间:2025年3月7日    来源:szf
阿里巴巴最新的 AI 模型击败 OpenAI 的 o1-mini,与 DeepSeek R1 相当

快速阅读: 《解密》消息,阿里云发布了新的推理型AI模型QwQ-32B,使用325亿参数,性能可媲美拥有6710亿参数的深搜r1。该模型基于阿里巴巴的Qwen2.5-32B基础模型,强调了强化学习在提升模型性能方面的有效性。QwQ-32B作为开源软件在Apache 2.0许可证下提供,但也存在一些局限性。阿里巴巴认为这是迈向通用人工智能(AGI)的重要一步。

解密艺术、时尚与娱乐中心。探索场景。阿里云发布了一款新的推理型AI模型,尽管规模远小于竞争对手,但其性能却能与之匹敌。中国科技巨头的云计算部门最新推出的这款产品挑战了“越大越好”的传统观念。该模型名为QwQ-32B,基于阿里巴巴的Qwen2.5-32B基础模型构建,使用了325亿个参数,性能可与拥有6710亿参数的深搜r1相媲美。这一大卫对抗歌利亚式的成就引起了全球AI研究人员和开发者的广泛关注。

“这一显著成果证明了强化学习在应用于预训练于广泛世界知识的强大基础模型时的有效性,”阿里巴巴Qwen团队今天在其公告博客中表示。“我们发现强化学习训练能够持续提升性能,尤其是在数学和编程方面。我们还观察到,持续的强化学习扩展有助于中等规模的模型在性能上与巨型MoE模型竞争。”

AI社区对此反响热烈。“绝对喜欢它!”数据科学家兼AI研究员瓦伊巴夫·斯里瓦斯塔瓦评论道,而哈金空间的首席技术官朱利安·肖蒙则表示该模型“颠覆了传统”。

当然,还有一些有趣的梗图。此外,奥拉玛和格罗宣布已支持该模型,这意味着用户现在可以在第三方应用中编程开源代理并使用此模型,同时借助格罗的基础设施实现前所未有的推理速度。这种效率提升标志着行业的潜在转变,以往的趋势一直是追求更大的模型。

QwQ-32B也有其局限性。它有时会遇到语言混合的问题,并且可能会陷入影响效率的递归推理循环。此外,与其他中国AI模型一样,它符合当地监管要求,可能限制对政治敏感话题的回应,并且上下文窗口有限,为32K令牌。

开源

与其他美国和西方国家的先进AI系统不同,这些系统通常处于付费墙后,QwQ-32B作为开源软件在Apache 2.0许可证下提供。此次发布紧随阿里巴巴一月份发布的Qwen 2.5-Max之后,该公司声称Qwen 2.5-Max在几乎所有方面都优于竞争对手。那次较早的发布正值中国农历新年庆祝期间,凸显了中国科技公司在快速发展的AI领域所面临的竞争压力。

中国模型在AI行业发展中的影响力如此之大,以至于前总统唐纳德·特朗普曾将它们的表现描述为硅谷的“警钟”,但他认为它们是“机遇而非威胁”。当深搜R1发布时,引发了股市的显著下跌,但QwQ-32B并未对投资者产生类似影响。纳斯达克整体下跌,主要是因为政治因素,而非阿里巴巴的影响所致。

不过,阿里巴巴仍将此次发布视为一个起点。“这标志着Qwen在增强推理能力方面迈出的第一步,”公司在博客中表示。“我们相信,结合更强大的基础模型与由大规模计算资源驱动的强化学习,将使我们更接近实现通用人工智能(AGI)。”

编辑:智能通讯:每周由生成式AI模型Gen讲述的AI旅程。请输入您的电子邮箱订阅!

(以上内容均由Ai生成)

关键词: AiDeepseekMinio1Openai

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日