DeepSeek更新推动国产芯片股价集体上涨
快速阅读: DeepSeek发布V3.1版本,新架构和国产芯片优化,大幅提升推理效率和使用灵活性,减少对国外算力依赖,引发资本市场热烈反应,概念股大涨。
DeepSeek官方发布V3.1版本,一条简短的消息引爆了整个AI圈。新架构和下一代国产芯片,短短二十字信息量巨大,引发广泛讨论。
经过两天的研究,老狐认为国产AI正步入软硬协同阶段,未来模型有望大幅减少对英伟达、AMD等国外算力的依赖。此次更新打破“性能越高成本越贵”的行业魔咒,金融、医疗等高算力应用场景的想象空间大开。
资本市场反应迅速,DeepSeek宣布更新后,国产芯片概念股应声上涨,每日互动尾盘直线拉升,收盘大涨13.62%。有网友戏称,国产芯片迎来史诗级暴涨,DeepSeek一句话,周五股市直冲3800点。
DeepSeek低调发布V3.1版本,未做大规模宣传。此次更新的核心创新在于混合推理架构——Hybrid Reasoning Architecture。该架构支持思考模式和非思考模式的即时切换,用户可根据需求选择分析方式。
此前,DeepSeek的产品线分工明确:V3模型擅长通用对话,R1模型侧重深度思考。这种分离式架构虽各有所长,但用户频繁切换不便。V3.1打破这一壁垒,将通用对话、复杂推理、专业编程等多种核心功能集于一体,提升使用灵活性和效率。
V3.1的推理效率显著提高。官方数据显示,在思考模式下,其在各项任务的平均表现与前代顶级R1-0528持平,但输出token数量减少20%至50%;非思考模式下,输出长度更短,性能不打折。这得益于“思维链压缩”技术,使模型在训练阶段生成更简洁高效的推理路径,确保答案准确。
此举旨在降低成本。过去,虽然思维链能增强模型推理能力,但冗长的中间步骤导致高昂的计算成本和API调用费用,难以大规模应用。V3.1的思维链压缩解决了这一问题,将高级AI推理能力从学术工具变为可大规模商业化的经济方案。
社区测试显示,DeepSeek V3.1在Aider多语言编程测试中的得分超过Claude 4 Opus,且成本更低。开发者纷纷点赞,Hugging Face上的热度飙升。
值得注意的是,DeepSeek V3.1采用UE8M0 FP8参数精度,并对分词器和聊天模板进行了调整,与之前的V3有明显区别。FP8将普通浮点数压缩为8位存储,节省空间和算力。MXFP8的“块缩放”方法进一步优化资源利用,使处理器恢复数据时更加高效。
UE8M0 FP8格式具有大动态范围,能同时表示极大和极小数值,减少信息损失。这对国产新芯片尤为适用,因为大多数国产AI芯片仍使用FP16/INT8方案,无法原生支持FP8。新一代芯片如摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU均支持原生FP8,DeepSeek V3.1的UE8M0格式与这些硬件完美匹配。
总之,UE8M0 FP8使模型在新一代国产芯片上运行更省空间、更快、更稳定,同时保持精度。DeepSeek官微特别提及这一点,为国产AI带来低成本、高性能的新机遇。
关于官网访问,官方确认App和网页端的“深度思考”功能已更新。推特X上有博主分析新模型生成的小球跳动效果更符合物理定律,还能调节重力、摩擦等参数。有人用V3.1制作振动编码,甚至绘制自画像。不过,也有用户反馈翻译和写作存在中英夹杂和错词现象。
感兴趣的用户可前往官网体验。老狐认为,每次DeepSeek更新都令人期待,几乎成为国产AI的精神图腾。让我们共同期待DeepSeek R2的到来。
(以上内容均由Ai生成)