标签: 长文本处理
-
DeepSeek发布V3.2双模型,长文本处理与深度思考显著提升
快速阅读: DeepSeek发布V3.2及V3.2-Speciale模型,核心升级为转正稀疏注意力技术,显著提升推理速度与效率,开源并支持商业化,未来有望在长文本处理与推理上领先。 DeepSeek 发布了 V3.2(标准版)和 V3.2- […]
发布时间:2025-12-03 11:21 来源:szf -
DeepSeek下一代技术获ACL2025最佳论文奖,长文本处理效率大幅提升
快速阅读: 据《AIbase – AI新闻资讯》称,7月11日,ACL2025颁奖典礼上,DeepSeek与北京大学等机构合作的论文获最佳论文奖。论文介绍了一种原生稀疏注意力(NSA)机制,显著提升了长文本处理速度和性能,将上下 […]
发布时间:2025-07-31 21:00 来源:szf -
DeepSeek获ACL2025最佳论文奖,长文本处理效率大幅提升
快速阅读: 据《AIbase – AI新闻资讯》称,7月11日,ACL2025颁奖典礼上,DeepSeek的梁文锋博士与北京大学等机构合作的论文获得最佳论文奖。论文提出原生稀疏注意力(NSA)机制,将长文本处理速度提升11倍,上 […]
发布时间:2025-07-31 13:20 来源:szf