DeepSeek获ACL2025最佳论文奖,长文本处理效率大幅提升

发布时间:2025年7月31日    来源:szf
DeepSeek获ACL2025最佳论文奖,长文本处理效率大幅提升

快速阅读: 据《AIbase – AI新闻资讯》称,7月11日,ACL2025颁奖典礼上,DeepSeek的梁文锋博士与北京大学等机构合作的论文获得最佳论文奖。论文提出原生稀疏注意力(NSA)机制,将长文本处理速度提升11倍,上下文长度扩展至100万tokens,显著优于传统全注意力模型,在多跳问答和代码理解等任务中表现突出。

在刚刚结束的 ACL2025颁奖典礼上,由 DeepSeek 的梁文锋博士作为通讯作者,与北京大学等机构联合发表的研究论文荣获 最佳 论文奖。这次会议规模空前,投稿数量几乎翻倍,达到了8360篇,竞争之激烈可见一斑。
该论文提出了一种名为原生稀疏注意力(NSA)的新机制,能在算法与硬件的协同优化下,将长文本的处理速度提升至惊人的11倍。而更为振奋的是,这项技术的性能不仅提升,反而超越了传统的全注意力模型。通过这项技术,研究团队成功将上下文长度扩展到了惊人的100万 tokens,这为未来的前沿模型奠定了基础。
NSA 机制的核心在于通过动态分层的稀疏策略,结合三条并行的注意力分支,有效捕捉文本中的重要信息。首先是 “压缩注意力”,负责提炼全局信息;其次是 “选择性注意力”,聚焦于重要的词块;最后是 “滑动注意力”,确保局部上下文的完整性。这种设计不仅让模型更为灵活,同时在现代 GPU 硬件上进行了深度优化,实现了原生可训练模式。
在测试中,NSA 在处理64k 长度的文本时,解码阶段速度提升了11.6倍,前向传播和反向传播速度分别提升了9倍和6倍。更重要的是,NSA 在各种基准测试中表现优异,27B 参数的模型在9个评测指标中有7个超越了全注意力基线,特别是在多跳问答和代码理解等复杂任务中展现了明显的优势。
这项研究为长文本处理开辟了新的可能性,真正实现了速度与精度的双赢,证明了 NSA 机制在 AI 领域的广泛应用前景。
论文地址:https://arxiv.org/pdf/2502.11089

(以上内容均由Ai生成)

你可能还想读

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

Apriority获230万美元种子轮融资,加入Techstars加速债务管理智能化

快速阅读: Apriority宣布完成230万美元种子轮融资,由Techstars等领投。平台利用AI技术优化债务管理,帮助借款人节省利息,掌握财务控制权,尤其惠及低收入家庭。 旧金山,2025年10月23日 —— 以借款人为核心的服务平台 […]

发布时间:2025年10月23日
Cercli获1200万美元融资,加速AI劳动力平台发展

Cercli获1200万美元融资,加速AI劳动力平台发展

快速阅读: 阿联酋工作管理平台Cercli获1200万美元A轮融资,由Picus Capital领投。资金将用于产品开发、AI创新及市场扩展,目标中东、欧洲和北美。Cercli实现每月22%增长率,客户覆盖50国。 总部位于阿联酋的工作管理 […]

发布时间:2025年10月23日
扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

扎克伯格裁撤600名AI工程师,但称AI仍是未来核心

快速阅读: Meta宣布裁减AI部门约600名工程师,涉及FAIR等多个团队,旨在精简业务提高效率。CEO扎克伯格重申AI仍是公司核心,将继续投资高级机器学习和超级智能项目。 Meta近日宣布从其人工智能(AI)部门裁员约600名工程师,此 […]

发布时间:2025年10月23日
Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

Andreessen Horowitz拟筹集100亿美元,加密货币未被列入重点

快速阅读: 风险投资公司a16z计划筹集100亿美元,重点投资AI和国防,未提及加密货币。此举令人意外,因a16z曾是加密领域的重要支持者,近期仍积极投资相关项目。 据报道,风险投资公司安德森·霍洛维茨(a16z)正在寻求筹集约100亿美元 […]

发布时间:2025年10月23日
花旗资助香港390万港元,助力贫困青年掌握AI技能

花旗资助香港390万港元,助力贫困青年掌握AI技能

快速阅读: 花旗基金会向香港“改变年轻生命基金会”捐赠50万美元,支持为期两年的“求职挑战”项目,提升弱势青少年的人工智能技能和求职能力,增强其就业竞争力。 花旗基金会向香港“改变年轻生命基金会”拨款50万美元(约390万港元),用于为期两 […]

发布时间:2025年10月23日
AI成新界面,企业转型加速

AI成新界面,企业转型加速

快速阅读: 自动驾驶技术从微小升级到移除方向盘,彻底改变车辆设计和旅程体验,重塑汽车与环境的关系。AI发展类似,通过小步快跑实现重大转变,成为统一的用户界面,改善客户互动体验。 多年来,汽车自主驾驶功能的发展似乎只是一系列微小的升级,比如车 […]

发布时间:2025年10月23日
实博蒂克斯成立顾问委员会,推动AI技术发展

实博蒂克斯成立顾问委员会,推动AI技术发展

快速阅读: Realbotix成立顾问委员会,增强AI技术,调整董事会。成员包括谷歌萨利姆·哈桑及转任的安德鲁·德苏扎,目标推进AI与机器人技术发展。弗雷德·派退休,公司感谢其贡献。调整优化产品,强化全球市场地位。 Realbotix公司宣 […]

发布时间:2025年10月23日
OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

OpenAI联手Vantage在威斯康星建数据中心,预计近吉瓦规模

快速阅读: OpenAI宣布在美国扩展Stargate数据中心计划,包括威斯康星州Lighthouse项目,预计2028年完工,将开发近1吉瓦电力,采用可持续能源和环保措施,创造数千就业岗位。 该设施是OpenAI在披露美国五个Starga […]

发布时间:2025年10月23日