AI

DeepSeek更新,国产芯片集体大涨

发布时间:2025年8月25日    来源:szf
DeepSeek更新,国产芯片集体大涨

快速阅读: DeepSeek推出V3.1版本,采用混合推理架构和UE8M0 FP8参数精度,大幅提升推理效率和成本效益,减少对国外算力依赖,引发资本市场积极响应,国产芯片概念股应声上涨。

DeepSeek 推出 V3.1 版本,官方一条简短消息引发 AI 行业热议。新架构与下一代国产芯片的结合,预示着国产 AI 正迈向软硬件协同阶段,未来有望减少对英伟达、AMD 等国外算力的依赖。

此次更新打破“性能越高成本越贵”的行业魔咒,金融、医疗等高算力应用场景的想象空间大幅扩展。资本市场迅速作出反应,DeepSeek 宣布更新后,国产芯片概念股应声上涨,每日互动尾盘直线拉升,收盘大涨 13.62%。有网友戏言,国产芯片迎来史诗级暴涨,DeepSeek 一句话带动周五股市冲上 3800 点。

DeepSeek 官方低调发布 V3.1 版本,未进行大规模宣传。V3.1 最核心的创新在于其混合推理架构——Hybrid Reasoning Architecture。该架构支持思考模式和非思考模式,用户可以自由切换,既可详细分析,也能快速得出结果。

此前,DeepSeek 的产品线分工明确:V3 模型擅长通用对话,R1 模型侧重深度思考。这种分离式架构虽各有所长,但用户需频繁切换。如今,V3.1 将通用对话、复杂推理、专业编程等多种核心功能集成在同一模型中,提升了使用灵活性和效率。

此外,V3.1 的推理效率显著提升。官方数据显示,在思考模式下,V3.1 在各项任务中的平均表现与前代顶级 R1-0528 持平,但输出的 token 数量减少了 20% 至 50%。非思考模式下,输出长度缩短,但性能不打折扣。这得益于“思维链压缩”技术,模型在训练阶段学会生成更简洁、高效的推理路径,确保答案准确。

为何要这样做?很简单,为了降低成本。过去,思维链虽然增强模型推理能力,但冗长的中间步骤导致高昂的计算成本和 API 调用费用,难以大规模应用。V3.1 的思维链压缩技术解决了这一问题,将高级 AI 推理能力从学术工具转变为经济可行的商业解决方案。

社区测试显示,DeepSeek V3.1 在 Aider 多语言编程测试中的得分超过 Claude 4 Opus,且成本更低。开发者纷纷点赞,Hugging Face 上的热度持续上升。

值得注意的是,DeepSeek V3.1 采用 UE8M0 FP8 参数精度,并对分词器和聊天模板进行了调整,与之前的 V3 版本有显著差异。FP8 将普通浮点数压缩为 8 位存储,节省空间和算力。MXFP8 的“块缩放”技术将数据分块,每块使用独立的缩放系数,既保留信息又节省资源。

UE8M0 中的 U、E、M 分别代表“无符号 + 指数 + 尾数”。UE8M0 用 8 位全表示指数,没有尾数和符号位,处理器还原数据时只需移动指数位,无需复杂乘法,速度快、路径短。这种格式动态范围广,能同时表示极大和极小的数,不易溢出或归零,确保 8 位张量精度的同时,将信息损失降至最低。

这一技术特别适合新一代国产芯片。目前,大多数国产 AI 芯片仍使用 FP16/INT8,无法原生支持 FP8。新一代芯片如摩尔线程 MUSA 3.1 GPU 和芯原 VIP9000 NPU 开始支持原生 FP8,与 DeepSeek V3.1 的 UE8M0 格式完美匹配。UE8M0 FP8 使模型在新一代国产芯片上运行更省空间、更快、更稳定,同时保持精度,为国产 AI 带来低成本、高性能的新机遇。

更新后,DeepSeek 官网确认“深度思考”功能已升级。推特上有博主分析,新模型生成的小球跳动效果更符合物理定律,可调节重力、摩擦、旋转速度和弹跳参数。还有用户用 V3.1 制作振动编码,甚至绘制自画像,风格独特。

尽管如此,部分用户仍对翻译和写作功能提出批评,认为 SYSTEM PROMPT 需要现场编写指令,中英混杂和错词现象时有发生。感兴趣的用户可以登录官网自行体验。每次 DeepSeek 的更新都令人期待,几乎成为国产 AI 的精神图腾,期待 DeepSeek R2 的到来。

(以上内容均由Ai生成)

你可能还想读

网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日