DeepSeek发布V3.2,推理能力比肩GPT-5

发布时间:2025年12月2日    来源:szf
DeepSeek发布V3.2,推理能力比肩GPT-5

快速阅读: DeepSeek发布新模型V3.2及Speciale版,强化智能体能力与推理,性能接近Gemini-3.0-Pro,显著减少计算开销,提升泛化能力,广泛应用于问答、推理测试等领域。

国产大模型风向标DeepSeek再次推出重磅新模型,重点强化智能体能力,并融入思考和推理过程。12月1日,DeepSeek发布了两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新至正式版DeepSeek-V3.2,而Speciale版本目前仅以临时API服务形式提供,用于社区评测与研究。

DeepSeek-V3.2旨在平衡推理能力和输出长度,适用于日常使用场景,如问答和通用智能体任务。在公开的推理类基准测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相较于Kimi-K2-Thinking,V3.2的输出长度显著缩短,有效减少了计算开销和用户等待时间。

据DeepSeek介绍,DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致。V3.2-Speciale是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力。DeepSeek-V3.2具备指令跟随、数学证明和逻辑验证能力,在主流推理基准测试中的表现可与Gemini-3.0-Pro媲美。

与以往版本不同,DeepSeek-V3.2首次实现了在思考模式下调用工具的功能,同时支持思考模式和非思考模式下的工具调用。该模型还提出了一种大规模智能体训练数据合成方法,在智能体评测中达到了当前开源模型的最高水平,显著缩小了开源模型与闭源模型之间的差距。值得注意的是,V3.2并未对这些测试集的工具进行特殊训练,因此在实际应用中展现出较强的泛化能力。

在评测成绩方面,DeepSeek-V3.2-Speciale在IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)和IOI 2025(国际信息学奥林匹克)中均获得了金牌。其中,ICPC和IOI的成绩分别达到了人类选手第二名和第十名的水平。

DeepSeek指出,在高度复杂的任务上,Speciale模型显著优于标准版本,但消耗的Token数量更多,成本更高。目前,DeepSeek-V3.2-Speciale主要用于研究,不支持工具调用,尚未针对日常对话和写作任务进行专门优化。

DeepSeek作为大模型的风向标,其一举一动都受到行业的广泛关注。最近,网易有道词典发布了2025年度词汇——“deepseek”,以8672940次年度搜索量成功当选。有道词典负责人表示,“deepseek”在词典内的搜索曲线呈现出明显的爆发趋势,自年初因“低成本”突破算力封锁以来,每次重要进展都会带动搜索量的上升。

(以上内容均由Ai生成)

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日