AI

Meta推出DeepConf技术,智能优化大模型推理成本与精度

发布时间:2025年9月4日    来源:szf
Meta推出DeepConf技术,智能优化大模型推理成本与精度

快速阅读: Meta AI 与 UCSD 推出 DeepConf 技术,通过模型内部置信度信号优化 LLM 推理路径,显著降低成本并提高准确率,适用于金融、法律等高风险场景,兼容现有推理框架。

近日,Meta AI 与加州大学圣地亚哥分校(UCSD)合作推出了一项名为 Deep Think with Confidence (DeepConf) 的新技术,旨在帮助企业降低大型语言模型(LLM)在复杂推理任务中的算力成本,同时保持高准确率。目前,提高 LLM 推理能力通常依赖于“自一致性 + 多次采样再表决”的策略,但这种方法会导致计算资源迅速膨胀,耗时且容易导致低质量推理路径胜出。DeepConf 的创新点在于,它通过模型内部的置信度信号,对推理路径进行筛选和权重调整,而不是对所有推理路径一视同仁。

DeepConf 引入了多种精细化的置信度指标,包括组置信度(Group Confidence),即计算推理过程中某一段 token 的平均置信度;尾部置信度(Tail Confidence),关注推理结尾部分的置信程度;最低组置信度(Lowest Group Confidence),找出推理路径中最“脆弱”的环节;底部百分位置信度(Bottom-10% Confidence),聚焦最不自信的部分推理内容。

DeepConf 提供了两种执行方式:离线模式(Offline Thinking),先生成多个完整的推理路径,再按置信度筛选较优路径参与表决或加权投票;在线模式(Online Thinking),在推理生成过程中实时评估,当当前路径置信度低于阈值时,立即终止该路径以节省资源。

在多个开放模型(如 DeepSeek-8B、Qwen3-32B、GPT-OSS-120B)及复杂数学与 STEM 推理任务(AIME、HMMT、BRUMO25、GPQA-Diamond)中,DeepConf 表现出色。在离线模式下,使用 GPT-OSS-120B 在 AIME2025 上的准确率达到 99.9%,同时生成的 token 数量比传统方法减少了 84.7%;在线模式下,在 AIME24 中,DeepSeek-8B 的准确率提高了 5.8 个百分点,而使用的 token 数量减少了 77.9%。

企业可以根据使用场景的风险偏好选择不同的设置:DeepConf-high(保守模式)通常可以减少约 50% 的生成成本,但准确性几乎不受影响,适用于金融、法律等高风险场景;DeepConf-low(激进模式)则可以节省 70%-85% 的 token,适用于对速度要求高但容错性较强的场景,如问答草稿、知识检索等。

使用 DeepConf 无需重新训练模型,只需在推理时增加少量逻辑处理。此外,它具有良好的兼容性,能够与现有的推理框架(如 vLLM、SGLang、TensorRT-LLM)无缝集成。研究者表示,这为企业部署 LLM 推理任务提供了一个“可插拔”的高效解决方案。

(以上内容均由Ai生成)

关键词: DeepConfMeta大模型

你可能还想读

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

快速阅读: 欧洲广播联盟和BBC报告显示,AI平台传播新闻存严重风险,影响新闻生态,Perplexity和谷歌AI加剧公众信任下降,研究发现来源、准确性和背景问题是主要障碍。 欧洲广播联盟和BBC发布的一份新报告显示,使用生成式人工智能平台 […]

发布时间:2025年10月23日
AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

快速阅读: 特朗普退让提振市场情绪,但股市上涨主因是AI热潮。自2022年11月ChatGPT推出以来,美国标普500指数市值增加21万亿美元。 特朗普倾向于退让提振了市场情绪,但推动股市上涨的主要动力是围绕生成式人工智能(AI)的炒作。在 […]

发布时间:2025年10月23日
北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

快速阅读: 挪威Riff完成1600万美元A轮融资,累计2100万美元,由Northzone领投。Riff提供AI应用开发平台,支持多行业,旨在提升商业效果和项目成功率,新资金将用于市场扩展。 总部位于奥斯陆的Riff(原名Databutt […]

发布时间:2025年10月23日
Meta裁减AI部门约600岗位,加速技术竞赛

Meta裁减AI部门约600岗位,加速技术竞赛

快速阅读: Meta Platforms 从超级智能实验室裁减约600个职位,以加速AI技术发展。AI首席Alexandr Wang通知裁员,旨在加快决策,增加员工责任。Meta继续为TBD实验室招聘,该团队聚集高薪AI人才。 据报道,Me […]

发布时间:2025年10月23日
渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

快速阅读: Gartner预测,至2026年80%企业将部署生成式AI,但安全与数据基础设施挑战成障碍。研究显示,近半数企业因安全顾虑暂缓云迁移,超半数数据无备份,70%企业过去一年遭遇网络攻击,平均损失五周生产力。VARs在协助企业克服安 […]

发布时间:2025年10月23日
英政府推出AI工具,大幅提高咨询反馈分析效率

英政府推出AI工具,大幅提高咨询反馈分析效率

快速阅读: 英国政府宣布加速人工智能发展,采用“汉弗莱”系列中的Consult工具,每年可节省75,000个人工工作日,该工具处理50,000份咨询回复仅需2小时,效率远超人工。 英国政府宣布,将加速推进人工智能的发展。此前一项研究发现,每 […]

发布时间:2025年10月23日
IBM新Z17主机助力营收大增,AI成增长引擎

IBM新Z17主机助力营收大增,AI成增长引擎

快速阅读: IBM在生成式AI领域赢得95亿美元订单,大型机收入同比增长59%,新Z17机器贡献显著。AI基础设施增长15%,存储成为关键销售点。 克里希纳指出,IBM在生成式AI领域赢得了95亿美元的订单,这是一个显著的成绩。此外,IBM […]

发布时间:2025年10月23日
英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

快速阅读: 特朗普政府正与多家量子计算公司谈判,拟通过联邦资金注资换取股权,涉及IonQ、Rigetti Computing等,每家获至少1000万美元。 感谢IT之家网友 小兴365 的线索投递! IT之家 10 月 23 日消息,据《华 […]

发布时间:2025年10月23日