DeepSeek发布V3.2及Speciale,性能再创新高
快速阅读: 12月4日,DeepSeek未预告发布V3.2和V3.2-Speciale,实现思考与工具调用融合,性能超越现有开源模型,无缝更新用户体验。
12月4日,DeepSeek官方未作预告,接连发布了两个新版本:正式版DeepSeek-V3.2和极致推理版DeepSeek-V3.2-Speciale。官网网页端、App及API均已完成一键切换,DeepSeek以实际行动再次巩固了其“开源最强”的地位。
此次发布的DeepSeek-V3.2的最大亮点在于首次实现了“思考过程”与“工具调用”的深度融合,支持两种工作模式:思考模式下,模型能够进行长链条推理后精准调用工具;而非思考模式则保持快速响应的特点。
通过海量Agent合成训练数据,V3.2在未经专项训练的情况下,轻松超越了当前所有智能体的公开评测成绩,不仅成为开源领域的领头羊,甚至接近了部分闭源顶级模型的表现。
DeepSeek-V3.2-Speciale则被视为推理能力的终极形态,旨在将开源模型的推理能力推向物理极限。该版本继承了DeepSeek-Math-V2在数学定理证明方面的顶级能力,在长链条逻辑、复杂问题分解及多步规划等场景中表现出卓越的稳定性。测试结果显示,在需要30步以上深度推理的任务中,Speciale的正确率远超现有所有开源模型,被社区戏称为“开源的o3/o4杀手”。
此次更新实现全平台秒级同步,用户无需任何操作,刷新页面即可体验新版功能,真正做到了无缝切换,让用户“一觉醒来模型就变强”。
AIbase独家点评:2025年伊始,DeepSeek便以两连发的形式给开源社区带来了巨大冲击。一方面,V3.2版本灵活高效;另一方面,Speciale版本则专注于极致推理能力,直接将“性能上限”与“易用性”推至极致。更令人惊讶的是,这仅仅是DeepSeek-V3系列的“点二”版本。当其他项目还在追求参数量和上下文长度时,DeepSeek已经迈出了“模型是否会思考”的一步。这次更新无疑将国产开源技术的天花板再次提升了三个层次。接下来,谁能接住这一挑战?
(以上内容均由Ai生成)