AI

DeepSeek更新,国产芯片集体暴涨

发布时间:2025年8月26日    来源:szf
DeepSeek更新,国产芯片集体暴涨

快速阅读: DeepSeek上线V3.1,采用混合推理架构和UE8M0 FP8参数精度,大幅提高推理效率和兼容性,减少计算成本,引发资本市场和开发者关注,国产芯片概念股大涨。

DeepSeek V3.1 上线,官方一条留言引爆了整个 AI 圈。新的架构和下一代国产芯片,短短不到 20 字的信息量满满,引发热议。

这两天,老狐看了不少科普文章后,简单理解为:国产 AI 正在走向软硬协同阶段,未来模型有望实质性减少对英伟达、AMD 等国外算力的依赖。同时,这次更新打破了“性能越高成本越贵”的行业魔咒,让金融、医疗等高算力场景的应用想象空间大增。

资本市场的反应也很直接:DeepSeek 一官宣,国产芯片概念股应声大涨,每日互动尾盘直线拉升,收盘大涨 13.62%。有网友调侃说,国产芯片迎来史诗级暴涨,DeepSeek 一句话,周五大盘直接冲上 3800 点。

这两天,DeepSeek 官方低调上线 V3.1 版本,没有铺天盖地的宣传。老狐整理了这次 V3.1 的更新,最核心、最有革命性的创新是其混合推理架构——Hybrid Reasoning Architecture。这个架构能同时支持思考模式和非思考模式,用户可以随时切换,需要慢慢分析时可以慢慢分析,需要快速出结果时也可以快速出结果。

以前,DeepSeek 的产品线分工明确:V3 模型擅长通用对话,R1 模型更偏深度思考。这种分离式架构的好处是,各个模型都能在自己擅长的领域表现不错,但用户来回切换很麻烦。现在,V3.1 打破了这种壁垒,将通用对话、复杂推理、专业编程等多种核心功能集成在同一个模型里,使使用体验更灵活,效率更高。

不仅如此,V3.1 的推理效率也大幅提升。官方数据显示,在思考模式下,它在各项任务的平均表现与前代顶级 R1-0528 持平,但输出的 token 数量减少了 20% 到 50%。在非思考模式下,输出长度更短,但性能不打折。这背后是“思维链压缩”在起作用:模型在训练阶段学会生成更简洁、高效的推理路径,同时保证答案准确。简单来说,就是算法更聪明了。

为什么要这样做?很简单:省钱!过去,思维链虽然能让模型推理更强,但冗长的中间步骤会带来高昂的计算成本和 API 调用费用,难以大规模应用。V3.1 的思维链压缩正好解决了这个问题,将高级 AI 推理能力从学术工具变成了可大规模商业化的经济方案。

社区测试中,DeepSeek V3.1 在 Aider 多语言编程测试中的分数已经超过 Claude 4 Opus,且成本更低。这下开发者们都在刷屏,Hugging Face 上的热度也迅速上升。

值得一提的是,DeepSeek 官宣 V3.1 时提到,这次模型采用了 UE8M0 FP8 的参数精度,同时对分词器和 chat template 也做了不小的调整,因此与之前的 V3 有明显区别。老狐简单学习后科普一下:FP8 是将普通浮点数压缩成 8 位来存储,既省空间又省算力。加上 MXFP8 的“块缩放”思路,将数据分块,每块有自己的缩放系数,既能保留信息,又能节省更多资源。U、E、M 分别代表“无符号 + 指数 + 尾数”。UE8M0 中所有 8 位都用来表示指数,没有尾数和符号位,这使得处理器复原数据时非常轻松,只需移动指数位,无需复杂乘法,速度快、路径短。这种格式的另一个优势是动态范围大,可以同时表示很大和很小的数,不易溢出或被压成 0,即在保证 8 位张量精度的同时,将信息损失降到最低。

这对国产新芯片特别合适,以前大部分国产 AI 芯片使用的是 FP16/INT8,无法原生支持 FP8。新一代芯片,如摩尔线程 MUSA 3.1 GPU、芯原 VIP9000 NPU,开始支持原生 FP8,DeepSeek V3.1 的 UE8M0 格式正好匹配这些硬件。总结一句话:UE8M0 FP8 让模型在新一代国产芯片上跑得更省空间、更快、更稳,同时保持精度。这也是为什么 DeepSeek 官微特别提到它,为国产 AI 带来了更低成本、高性能的新可能。

更新后,用户关心的官网能否直接访问,官方也给出了答案。打开官网一看,DeepSeek 将 App 和网页端的“深度思考(R1)”改成了“深度思考”,官方确认了网友之前的猜测——模型已经更新。网友们也玩出了新花样。推特 X 上有 AI 博主分析新模型生成的小球跳动效果更符合物理定律,还能调节重力、摩擦、旋转速度、弹跳等参数。有人直接用 DeepSeek V3.1 做了个振动编码,当场变身 VJ。更有网友让 V3.1 为自己画了个自画像,画风意外特别。不过,社区中仍有部分用户吐槽翻译和写作,SYSTEM PROMPT 需要现场写指令,中英夹杂和错词偶尔出现,有些混乱。

感兴趣的用户现在可以上官网自行体验。老狐认为,每次 DeepSeek 更新都让人期待下一次,几乎快成了国产 AI 的精神图腾,一起期待 DeepSeek R2 吧。

(以上内容均由Ai生成)

你可能还想读

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

快速阅读: Apriority宣布完成230万美元种子轮融资,由Techstars等领投。平台利用AI技术优化债务管理,帮助借款人节省利息,掌握财务控制权,尤其惠及低收入家庭。 旧金山,2025年10月23日 —— 以借款人为核心的服务平台 […]

发布时间:2025年10月23日
Cercli获1200万美元融资,加速AI劳动力平台发展

Cercli获1200万美元融资,加速AI劳动力平台发展

快速阅读: 阿联酋工作管理平台Cercli获1200万美元A轮融资,由Picus Capital领投。资金将用于产品开发、AI创新及市场扩展,目标中东、欧洲和北美。Cercli实现每月22%增长率,客户覆盖50国。 总部位于阿联酋的工作管理 […]

发布时间:2025年10月23日
扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

快速阅读: Meta宣布裁减AI部门约600名工程师,涉及FAIR等多个团队,旨在精简业务提高效率。CEO扎克伯格重申AI仍是公司核心,将继续投资高级机器学习和超级智能项目。 Meta近日宣布从其人工智能(AI)部门裁员约600名工程师,此 […]

发布时间:2025年10月23日
Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

快速阅读: 风险投资公司a16z计划筹集100亿美元,重点投资AI和国防,未提及加密货币。此举令人意外,因a16z曾是加密领域的重要支持者,近期仍积极投资相关项目。 据报道,风险投资公司安德森·霍洛维茨(a16z)正在寻求筹集约100亿美元 […]

发布时间:2025年10月23日
花旗资助香港390万港元,助力贫困青年掌握AI技能

花旗资助香港390万港元,助力贫困青年掌握AI技能

快速阅读: 花旗基金会向香港“改变年轻生命基金会”捐赠50万美元,支持为期两年的“求职挑战”项目,提升弱势青少年的人工智能技能和求职能力,增强其就业竞争力。 花旗基金会向香港“改变年轻生命基金会”拨款50万美元(约390万港元),用于为期两 […]

发布时间:2025年10月23日
AI成新界面,企业转型加速

AI成新界面,企业转型加速

快速阅读: 自动驾驶技术从微小升级到移除方向盘,彻底改变车辆设计和旅程体验,重塑汽车与环境的关系。AI发展类似,通过小步快跑实现重大转变,成为统一的用户界面,改善客户互动体验。 多年来,汽车自主驾驶功能的发展似乎只是一系列微小的升级,比如车 […]

发布时间:2025年10月23日
实博蒂克斯成立顾问委员会,推动AI技术发展

实博蒂克斯成立顾问委员会,推动AI技术发展

快速阅读: Realbotix成立顾问委员会,增强AI技术,调整董事会。成员包括谷歌萨利姆·哈桑及转任的安德鲁·德苏扎,目标推进AI与机器人技术发展。弗雷德·派退休,公司感谢其贡献。调整优化产品,强化全球市场地位。 Realbotix公司宣 […]

发布时间:2025年10月23日
OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

快速阅读: OpenAI宣布在美国扩展Stargate数据中心计划,包括威斯康星州Lighthouse项目,预计2028年完工,将开发近1吉瓦电力,采用可持续能源和环保措施,创造数千就业岗位。 该设施是OpenAI在披露美国五个Starga […]

发布时间:2025年10月23日