DeepSeek一句话引爆国产芯片市场，揭秘UE8M0 FP8技术

发布时间：2025年8月23日来源：szf

快速阅读: DeepSeek发布V3.1，引入UE8M0 FP8技术，推动国产芯片性能提升，寒武纪等企业股价大涨，市场关注度上升，标志中国AI产业迈向新阶段。

DeepSeek发布V3.1版本后，官方一条简短的消息引起AI圈轰动：新的架构、下一代国产芯片，短短不到20字的信息量巨大。消息发布后，国产芯片企业股价随之上涨，如寒武纪早盘涨幅接近14%，总市值跃居科创板首位。半导体ETF也在半天内上涨5.89%。面对这一波热潮，许多人开始探讨UE8M0 FP8的具体含义及其与下一代国产芯片的关系。

在知乎上，许多专业人士纷纷发表见解，试图解答大众心中的疑问。他们指出，“UE8M0 FP8”可以拆分为两部分理解，前面的UE8M0是MXFP8路径中的“缩放因子”。MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》中定义的8位微缩块格式。该项目由Facebook（现Meta）、英特尔、Rackspace等公司于2011年发起，旨在通过共享数据中心及服务器设计推动行业效率提升，成员包括国内外众多知名科技企业。

MXFP8基于FP8构建，后者是一种将常规浮点格式压缩到8位的编码方式。MXFP8的核心在于将张量切分为固定长度的“块”，并为每个块指定一个2的整数次幂作为“缩放因子”，再将块内所有数值除以此系数后转换为FP8格式。这种方式不仅保留了8位宽度，还显著扩展了动态范围。UE8M0中的“U”表示无符号，E8M0意味着8位全部用于指数位，不包含尾数和符号位。

采用全指数表示缩放因子的UE8M0具有多重优势。首先，处理器复原数据时只需移动指数位，无需执行复杂的浮点运算，从而缩短时钟关键路径。其次，UE8M0的动态范围覆盖2^(-127)至2^128，能够有效应对大/小值问题，减少信息损失。此外，UE8M0还解决了传统FP8无法兼顾大/小值导致的溢出或归零问题，提高了数据精度。

尽管大多数已量产的国产AI加速器仍采用FP16/BF16+INT8的计算路径，但新一代国产芯片如摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等已经开始支持“原生FP8”或“Block FP8”，并与DeepSeek等15家厂商联合验证UE8M0格式。尽管下一代国产芯片在HBM/LPDDR带宽方面仍落后于顶级产品，但UE8M0通过减少数据传输量，被视为未来架构的重要优化方向。

随着UE8M0 FP8概念的普及，市场对相关芯片厂商的关注度持续上升。首批通过“DeepSeek大模型适配”的8家企业中，寒武纪因其在低精度计算优化方面的领先地位备受瞩目。截至当日10:25，寒武纪股价大涨近14%，总市值突破4940亿元，超越中芯国际成为科创板市值第一。其他如海光、沐曦、中昊芯英以及摩尔线程等企业也被认为是潜在受益者。此外，华为昇腾虽暂不支持原生FP8，但官方路线图显示2025年第四季度将实现原生FP8支持，预示着未来可能推出的新品将是“下一代芯片”。

市场对国产芯片概念的集体高开反映了投资者对未来前景的信心。UE8M0 FP8的引入不仅提升了国产AI芯片的性价比，还标志着中国AI产业正迈向软硬协同发展的新阶段，有助于降低对外部算力的依赖。DeepSeek通过调整精度格式，主动适应国产芯片的最佳性能点，推动形成统一的生态系统，类似于昔日的“Wintel联盟”。

值得一提的是，DeepSeek在V3.1版本更新说明中仅简要提及UE8M0 FP8参数精度，直到官方在评论区补充说明才引起广泛关注。这一举动或许无意，但也透露出某种微妙的信号。

(以上内容均由Ai生成)