AI

DeepSeek更新推动国产芯片集体上涨

发布时间:2025年8月25日    来源:szf
DeepSeek更新推动国产芯片集体上涨

快速阅读: DeepSeek上线V3.1版本,采用混合推理架构,提升推理效率,降低成本,支持国产芯片,引发资本市场关注,概念股大幅上涨。

DeepSeek 官方上线 V3.1 版本,一条简短的留言引爆了整个 AI 圈。新的架构和下一代国产芯片,短短不到 20 字的信息量巨大,引发广泛讨论。经过科普文章的解读,可以理解为国产 AI 正逐步实现软硬件协同,未来有望减少对英伟达、AMD 等国外算力的依赖。

此次更新还打破了“性能越高成本越贵”的行业魔咒,金融、医疗等高算力应用场景的潜力显著提升。资本市场对此反应迅速,DeepSeek 宣布更新后,国产芯片概念股大幅上涨,每日互动尾盘直线拉升,收盘大涨 13.62%。有网友戏称,国产芯片迎来史诗级暴涨,DeepSeek 一句话,周五股市直冲 3800 点。

DeepSeek V3.1 版本低调上线,没有大肆宣传。这次更新的核心创新在于其混合推理架构——Hybrid Reasoning Architecture。该架构支持思考模式和非思考模式,用户可以随时切换,既可以选择详细分析,也可以快速得出结果。

此前,DeepSeek 的产品线分工明确:V3 模型擅长通用对话,R1 模型则更注重深度思考。这种分离式架构的优点是各模型在其擅长领域表现良好,但用户需要频繁切换,使用不便。如今,V3.1 打破了这一壁垒,将通用对话、复杂推理、专业编程等多种核心功能集成在同一模型中,提升了使用体验和效率。

此外,V3.1 的推理效率也有显著提升。官方数据显示,在思考模式下,V3.1 在各项任务中的平均表现与前代顶级 R1-0528 相当,但输出的 token 数量减少了 20% 至 50%。在非思考模式下,输出长度更短,但性能不打折扣。这得益于“思维链压缩”技术,使模型在训练过程中生成更简洁、高效的推理路径,确保答案准确。

为何要采取这种方式?简单来说,是为了降低成本。过去,思维链虽能增强模型推理能力,但冗长的中间步骤导致高昂的计算成本和 API 调用费用,难以大规模应用。V3.1 的思维链压缩技术解决了这一问题,使高级 AI 推理能力从学术工具变为可大规模商业化的经济方案。

在社区测试中,DeepSeek V3.1 在 Aider 多语言编程测试中的得分超过 Claude 4 Opus,且成本更低。这引起了开发者的广泛关注,Hugging Face 上的热度迅速上升。

值得一提的是,DeepSeek V3.1 使用了 UE8M0 FP8 参数精度,并对分词器和聊天模板进行了调整,与之前的 V3 版本有明显区别。FP8 是一种将普通浮点数压缩为 8 位存储的技术,既节省空间又提高计算效率。MXFP8 的“块缩放”方法将数据分块,每块使用自己的缩放系数,从而在不丢失大量信息的情况下进一步节省资源。

UE8M0 中的 U、E、M 分别代表“无符号 + 指数 + 尾数”。在 UE8M0 中,所有 8 位都用于表示指数,没有尾数和符号位,这使得处理器在复原数据时更加轻松,只需移动指数位,无需复杂乘法,速度快、路径短。这种格式的另一大优势是动态范围大,能够同时表示极大和极小的数,不易溢出或归零,从而在保持 8 位张量精度的同时,将信息损失降至最低。

对于国产新芯片而言,这一技术尤为适用。目前,大多数国产 AI 芯片仍采用 FP16/INT8,无法原生支持 FP8。新一代芯片如摩尔线程 MUSA 3.1 GPU 和芯原 VIP9000 NPU 开始支持原生 FP8,DeepSeek V3.1 的 UE8M0 格式正好匹配这些硬件。总结来说,UE8M0 FP8 使模型在新一代国产芯片上运行更高效、更稳定,同时保持精度。

DeepSeek 官方确认,V3.1 版本已将 App 和网页端的“深度思考(R1)”功能更名为“深度思考”。一些网友在推特 X 上分享了新模型生成的小球跳动效果,更符合物理定律,还能调节重力、摩擦、旋转速度等参数。有人用 V3.1 制作了振动编码,甚至有人让 V3.1 为自己画了一幅自画像,风格独特。

然而,也有部分用户反映翻译和写作方面存在问题,SYSTEM PROMPT 需要现场编写指令,中英混杂和错词现象时有发生。感兴趣的用户可以登录官网自行体验。DeepSeek 每次更新都令人期待,几乎成为国产 AI 的精神图腾,让我们共同期待 DeepSeek R2 的到来。

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日