DeepSeek一句话引爆国产芯片市场,揭秘UE8M0 FP8技术
快速阅读: DeepSeek发布V3.1,引入UE8M0 FP8技术,推动国产芯片性能提升,寒武纪等企业股价大涨,市场关注度上升,标志中国AI产业迈向新阶段。
DeepSeek发布V3.1版本后,官方一条简短的消息引起AI圈轰动:新的架构、下一代国产芯片,短短不到20字的信息量巨大。消息发布后,国产芯片企业股价随之上涨,如寒武纪早盘涨幅接近14%,总市值跃居科创板首位。半导体ETF也在半天内上涨5.89%。面对这一波热潮,许多人开始探讨UE8M0 FP8的具体含义及其与下一代国产芯片的关系。
在知乎上,许多专业人士纷纷发表见解,试图解答大众心中的疑问。他们指出,“UE8M0 FP8”可以拆分为两部分理解,前面的UE8M0是MXFP8路径中的“缩放因子”。MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》中定义的8位微缩块格式。该项目由Facebook(现Meta)、英特尔、Rackspace等公司于2011年发起,旨在通过共享数据中心及服务器设计推动行业效率提升,成员包括国内外众多知名科技企业。
MXFP8基于FP8构建,后者是一种将常规浮点格式压缩到8位的编码方式。MXFP8的核心在于将张量切分为固定长度的“块”,并为每个块指定一个2的整数次幂作为“缩放因子”,再将块内所有数值除以此系数后转换为FP8格式。这种方式不仅保留了8位宽度,还显著扩展了动态范围。UE8M0中的“U”表示无符号,E8M0意味着8位全部用于指数位,不包含尾数和符号位。
采用全指数表示缩放因子的UE8M0具有多重优势。首先,处理器复原数据时只需移动指数位,无需执行复杂的浮点运算,从而缩短时钟关键路径。其次,UE8M0的动态范围覆盖2^(-127)至2^128,能够有效应对大/小值问题,减少信息损失。此外,UE8M0还解决了传统FP8无法兼顾大/小值导致的溢出或归零问题,提高了数据精度。
尽管大多数已量产的国产AI加速器仍采用FP16/BF16+INT8的计算路径,但新一代国产芯片如摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等已经开始支持“原生FP8”或“Block FP8”,并与DeepSeek等15家厂商联合验证UE8M0格式。尽管下一代国产芯片在HBM/LPDDR带宽方面仍落后于顶级产品,但UE8M0通过减少数据传输量,被视为未来架构的重要优化方向。
随着UE8M0 FP8概念的普及,市场对相关芯片厂商的关注度持续上升。首批通过“DeepSeek大模型适配”的8家企业中,寒武纪因其在低精度计算优化方面的领先地位备受瞩目。截至当日10:25,寒武纪股价大涨近14%,总市值突破4940亿元,超越中芯国际成为科创板市值第一。其他如海光、沐曦、中昊芯英以及摩尔线程等企业也被认为是潜在受益者。此外,华为昇腾虽暂不支持原生FP8,但官方路线图显示2025年第四季度将实现原生FP8支持,预示着未来可能推出的新品将是“下一代芯片”。
市场对国产芯片概念的集体高开反映了投资者对未来前景的信心。UE8M0 FP8的引入不仅提升了国产AI芯片的性价比,还标志着中国AI产业正迈向软硬协同发展的新阶段,有助于降低对外部算力的依赖。DeepSeek通过调整精度格式,主动适应国产芯片的最佳性能点,推动形成统一的生态系统,类似于昔日的“Wintel联盟”。
值得一提的是,DeepSeek在V3.1版本更新说明中仅简要提及UE8M0 FP8参数精度,直到官方在评论区补充说明才引起广泛关注。这一举动或许无意,但也透露出某种微妙的信号。
(以上内容均由Ai生成)