AI

通义千问推出Qwen3-4B系列小模型 手机也能轻松跑

发布时间:2025年8月7日    来源:szf
通义千问推出Qwen3-4B系列小模型 手机也能轻松跑

快速阅读: 7月11日,通义千问发布Qwen3-4B系列模型,体积小巧性能强大,适用于手机等端侧硬件部署,开源后吸引众多开发者关注。

7月11日,通义千问发布了Qwen3-4B系列模型。这一新模型体积小巧,性能强大,为人工智能的端侧部署带来新的可能性。

在前两周,通义千问先后更新了Qwen3-235B-A22B和Qwen3-30B-A3B的Instruct/Thinking「2507」版本。如今,研发团队再次推出更小尺寸的Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507模型。这些新模型在性能上取得显著提升,尤其在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano,而在推理领域,Qwen3-4B-Thinking-2507的表现令人瞩目,其推理能力可与中等规模的Qwen3-30B-A3B(thinking)相媲美。

研发团队认为,小型语言模型(SLM)对代理人工智能(Agentic AI)的发展具有重要价值。此次发布的「2507」版本Qwen3-4B模型,不仅体积小,性能强劲,而且对手机等端侧硬件部署极为友好。目前,新模型已在魔搭社区和Hugging Face正式开源,吸引了众多开发者的关注和体验。

Qwen3-4B-Instruct-2507的通用能力显著提升,其表现超越了商业闭源的小尺寸模型GPT-4.1-nano,甚至与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。此外,该模型还覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。更令人惊喜的是,其上下文理解能力扩展至256K,即使是小模型,也能轻松处理长文本。

与此同时,Qwen3-4B-Thinking-2507的推理能力也大幅增强。在聚焦数学能力的AIME25测评中,该模型以4B参数量斩获了81.3分的惊人成绩,这一表现足以媲美中等模型Qwen3-30B-Thinking。此外,其通用能力显著提升,Agent分数更是超越了更大尺寸的Qwen3-30B-Thinking模型。同样具备256K tokens的上下文理解能力,支持更复杂的文档分析、长篇内容生成以及跨段落推理等场景。

随着Qwen3-4B系列模型的发布,人工智能在端侧应用的前景变得更加广阔。相信在不久的将来,我们会看到更多基于这一模型的创新应用,为人们的生活和工作带来更多便利。

(以上内容均由Ai生成)

你可能还想读

Snapchat免费开放“Imagine Lens”,AI图像生成全民可用

Snapchat免费开放“Imagine Lens”,AI图像生成全民可用

快速阅读: Snapchat宣布其AI工具“Imagine Lens”免费开放给所有用户,旨在对抗Meta AI和OpenAI的竞争,支持用户通过文本提示生成个性化图像,功能现已在美国上线,并计划扩展至更多国家。 Snapchat正式宣布, […]

发布时间:2025年10月23日
昆仑万维SkyReels全新版11月初上线,推动AI视频创作平民化

昆仑万维SkyReels全新版11月初上线,推动AI视频创作平民化

快速阅读: 昆仑万维AI视频产品SkyReels全新版本11月初上线,巩固其全球领先位置,推动全民视频创作。产品涵盖长视频生成、角色一致性等技术,已开源多个SOTA模型,促进AI视频创作平民化。 昆仑万维的AI视频产品SkyReels宣布, […]

发布时间:2025年10月23日
LiblibAI获1.3亿美元融资,成国内最大AI应用投资

LiblibAI获1.3亿美元融资,成国内最大AI应用投资

快速阅读: LiblibAI完成1.3亿美元B轮融资,由红杉中国等领投,成为国内AI应用领域最大融资。公司以多模态模型和创作社区为核心,已孵化超2000万AI创作者,计划加速全球化布局,推出2.0版“AI专业创作工作室”。 据Z Poten […]

发布时间:2025年10月23日
苹果MIND团队加速招聘,应对AI模型推理缺陷

苹果MIND团队加速招聘,应对AI模型推理缺陷

快速阅读: 苹果因最新研究揭示大型推理模型缺陷,正加快招聘AI领域高级人才。西雅图MIND团队招募专家,目标开发更准确高效的LLM和VLM架构,解决现有AI模型局限,推进下一代AI技术。 在苹果公司最近发布一项引发广泛讨论的研究,揭示当前大 […]

发布时间:2025年10月23日
Meta裁撤600人重塑AI架构,扎克伯格力挺新战略

Meta裁撤600人重塑AI架构,扎克伯格力挺新战略

快速阅读: Meta调整AI部门,计划裁员约600人,旨在减少官僚、加速决策。新成立的TBD Lab不受影响并将扩张,CEO扎克伯格支持AI主管Wang的策略。此次变动背景为内部关系紧张,部分科学家与管理层存分歧。 Meta公司正在对其人工 […]

发布时间:2025年10月23日
阿里“C计划”首发:夸克对话助手抢占AI市场

阿里“C计划”首发:夸克对话助手抢占AI市场

快速阅读: 阿里巴巴推出夸克App对话助手,采用Qwen最新闭源模型,集成问答、搜索、拍照搜题等功能,月活用户超1.5亿,主打25岁以下年轻市场,为阿里“C计划”首秀。 阿里巴巴“C计划”的 首款 产品近日正式揭晓,即夸克App上线的对话助 […]

发布时间:2025年10月23日
火山引擎发布Seedance1.0pro,首尾帧能力提升AI视频创作水平

火山引擎发布Seedance1.0pro,首尾帧能力提升AI视频创作水平

快速阅读: 火山引擎上线豆包视频生成模型1.0pro,提升AI视频创作的可控性和一致性,支持复杂场景和大幅运动的真实物理呈现,为企业和个人用户提供强大工具。 火山引擎正式上线了豆包视频生成模型1.0pro(Doubao-Seedance-1 […]

发布时间:2025年10月23日
生数科技Vidu Q2视频大模型API全面开放接入

生数科技Vidu Q2视频大模型API全面开放接入

快速阅读: 生数科技宣布Vidu Q2视频大模型API全面开放,该技术在广告、商品展示等领域展现独特价值,通过精细的表情生成技术提升视频的情感表现力,增强用户转化率。 近日,生数科技正式宣布 Vidu Q2参考生视频大模型 API 全面开放 […]

发布时间:2025年10月23日