AI

DeepSeek一句话引爆国产芯片市场,揭秘UE8M0 FP8技术

发布时间:2025年8月23日    来源:szf
DeepSeek一句话引爆国产芯片市场,揭秘UE8M0 FP8技术

快速阅读: DeepSeek发布V3.1,引入UE8M0 FP8技术,推动国产芯片性能提升,寒武纪等企业股价大涨,市场关注度上升,标志中国AI产业迈向新阶段。

DeepSeek发布V3.1版本后,官方一条简短的消息引起AI圈轰动:新的架构、下一代国产芯片,短短不到20字的信息量巨大。消息发布后,国产芯片企业股价随之上涨,如寒武纪早盘涨幅接近14%,总市值跃居科创板首位。半导体ETF也在半天内上涨5.89%。面对这一波热潮,许多人开始探讨UE8M0 FP8的具体含义及其与下一代国产芯片的关系。

在知乎上,许多专业人士纷纷发表见解,试图解答大众心中的疑问。他们指出,“UE8M0 FP8”可以拆分为两部分理解,前面的UE8M0是MXFP8路径中的“缩放因子”。MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》中定义的8位微缩块格式。该项目由Facebook(现Meta)、英特尔、Rackspace等公司于2011年发起,旨在通过共享数据中心及服务器设计推动行业效率提升,成员包括国内外众多知名科技企业。

MXFP8基于FP8构建,后者是一种将常规浮点格式压缩到8位的编码方式。MXFP8的核心在于将张量切分为固定长度的“块”,并为每个块指定一个2的整数次幂作为“缩放因子”,再将块内所有数值除以此系数后转换为FP8格式。这种方式不仅保留了8位宽度,还显著扩展了动态范围。UE8M0中的“U”表示无符号,E8M0意味着8位全部用于指数位,不包含尾数和符号位。

采用全指数表示缩放因子的UE8M0具有多重优势。首先,处理器复原数据时只需移动指数位,无需执行复杂的浮点运算,从而缩短时钟关键路径。其次,UE8M0的动态范围覆盖2^(-127)至2^128,能够有效应对大/小值问题,减少信息损失。此外,UE8M0还解决了传统FP8无法兼顾大/小值导致的溢出或归零问题,提高了数据精度。

尽管大多数已量产的国产AI加速器仍采用FP16/BF16+INT8的计算路径,但新一代国产芯片如摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等已经开始支持“原生FP8”或“Block FP8”,并与DeepSeek等15家厂商联合验证UE8M0格式。尽管下一代国产芯片在HBM/LPDDR带宽方面仍落后于顶级产品,但UE8M0通过减少数据传输量,被视为未来架构的重要优化方向。

随着UE8M0 FP8概念的普及,市场对相关芯片厂商的关注度持续上升。首批通过“DeepSeek大模型适配”的8家企业中,寒武纪因其在低精度计算优化方面的领先地位备受瞩目。截至当日10:25,寒武纪股价大涨近14%,总市值突破4940亿元,超越中芯国际成为科创板市值第一。其他如海光、沐曦、中昊芯英以及摩尔线程等企业也被认为是潜在受益者。此外,华为昇腾虽暂不支持原生FP8,但官方路线图显示2025年第四季度将实现原生FP8支持,预示着未来可能推出的新品将是“下一代芯片”。

市场对国产芯片概念的集体高开反映了投资者对未来前景的信心。UE8M0 FP8的引入不仅提升了国产AI芯片的性价比,还标志着中国AI产业正迈向软硬协同发展的新阶段,有助于降低对外部算力的依赖。DeepSeek通过调整精度格式,主动适应国产芯片的最佳性能点,推动形成统一的生态系统,类似于昔日的“Wintel联盟”。

值得一提的是,DeepSeek在V3.1版本更新说明中仅简要提及UE8M0 FP8参数精度,直到官方在评论区补充说明才引起广泛关注。这一举动或许无意,但也透露出某种微妙的信号。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日