Meta研发新技术,揭示并修复大语言模型推理错误

发布时间:2025年10月31日    来源:szf
Meta研发新技术,揭示并修复大语言模型推理错误

快速阅读: Meta与爱丁堡大学合作开发CRV技术,能预测并修复LLM推理错误,通过观察模型内部“推理电路”,提高AI可靠性,为未来模型调试奠定基础。

近日,Meta 的人工智能研究团队与爱丁堡大学合作,开发了一种新技术,能够预测大型语言模型(LLM)推理的正确性,并在发现错误时进行修复。这种名为电路基础推理验证(CRV)的方法,旨在深入观察 LLM 的内部 “推理电路”,以便在模型解决问题时检测出计算错误的迹象。

研究表明,CRV 可以通过构建并观察模型内部激活的计算图,以高准确率检测到 LLM 的推理错误。这一突破性的发现意味着研究人员可以利用深层次的内部信息,对模型的错误推理进行针对性的干预。

链式思维推理(CoT)作为一种提升 LLM 在复杂任务上表现的方法,已经被广泛应用,但它的可靠性依然存在问题。现有的验证方法主要分为两类:“黑箱” 方法通过分析最终生成的 token 或置信度分数来验证;“灰箱” 方法则试图观察模型的内部状态,然而这些方法并不能解释计算失败的根本原因。

CRV 采用了一种 “白箱” 验证方法,认为模型在执行任务时会使用专门的神经元子图。通过替换标准的稠密层为训练过的 “转码器”,研究人员使目标 LLM 变得可解释,从而可以观察到其内部工作原理。接着,CRV 会构建一个 “归因图”,映射信息在模型各个部分之间的因果流动,并提取出描述图特性的 “结构指纹”。最终,训练一个 “诊断分类器” 来预测推理步骤是否正确。

研究团队在 Llama3.1模型上进行了实验,结果表明,CRV 在各种数据集和指标上均优于其他验证方法,展现了其强大的有效性。同时,研究发现,不同推理任务中的错误签名具有领域特异性,这意味着不同类型的推理依赖于不同的内部电路。

最重要的是,CRV 不仅仅是相关性分析,它提供了一种透明的计算视图,使得预测的失败可以追溯到特定组件,研究人员因此可以通过抑制错误特征,实时修正模型的推理路径。

划重点: 🌟 CRV 技术能有效预测并修复 LLM 的推理错误,提高 AI 的可靠性。

🧠 研究采用了 “白箱” 验证方法,揭示了 LLM 的内部推理电路。

🔧 CRV 的成功应用为未来 AI 模型调试工具的开发奠定了基础。

(以上内容均由Ai生成)

你可能还想读

MetaX上市首日暴涨688%

MetaX上市首日暴涨688%

快速阅读: 12月17日消息,国产芯片企业MetaX与摩尔线程受资本市场热捧,股价大幅上涨,反映出投资者对AI芯片国产化替代的强烈信心。此轮热潮源于国家推动关键技术自主可控的战略以及AI算力需求激增,相关企业获得政策与资金支持,加速降低对进 […]

发布时间:2025年12月17日
Okta发布AI代理安全新标准

Okta发布AI代理安全新标准

快速阅读: 12月17日消息,Okta联合IETF提出“身份断言授权许可”(IAAG)标准,以应对AI代理普及带来的企业数据安全风险。谷歌、亚马逊等多家科技企业已支持该标准,通过强化组织级身份管控,统一管理人类用户与AI代理的访问权限,防范 […]

发布时间:2025年12月17日
5招识别AI与人类作者

5招识别AI与人类作者

快速阅读: 据多家机构披露,人工智能生成内容频现无端插入的极简疑问句,如“而且说实话?”,缺乏上下文支撑。专家指出,此类冗余修辞削弱文本连贯性,暴露大模型在语境理解与语言组织方面的局限。 近日,人工智能生成内容的语言特征引发关注。部分聊天机 […]

发布时间:2025年12月17日
一加推安卓16更新简化iPhone迁移

一加推安卓16更新简化iPhone迁移

快速阅读: 记者从一加公司获悉,该公司近日在北美分批推送OxygenOS 16.0.1.300系统更新,首批覆盖一加Open折叠屏手机,新增Trinity引擎性能优化、AI功能升级,并改进相册与视频编辑器,预计数日内完成全面覆盖。 一加公司 […]

发布时间:2025年12月17日
LLM能否破解AIOps落地困局

LLM能否破解AIOps落地困局

快速阅读: 据多方确认,阿里云与云杉网络正推动LLM Agent在智能运维领域的落地,依托操作系统底座与eBPF技术提升协同效率;尽管受限于大模型“幻觉”问题,但通过安全护栏与生态共建,加速实现“零运维”愿景。 在大模型技术加速渗透运维领域 […]

发布时间:2025年12月17日
FrontierScience发布新基准评估AI科学推理能力

FrontierScience发布新基准评估AI科学推理能力

快速阅读: 12月17日消息,研究团队推出新基准FrontierScience,用于评估AI在物理、化学、生物等领域的科研推理能力。GPT-5.2在竞赛型任务中得分77%,但在真实科研场景中仅得25%,显示其在开放式思维上仍存局限。 在科学 […]

发布时间:2025年12月17日
微信输入法iOS版3.0上线 支持15种方言离线语音输入

微信输入法iOS版3.0上线 支持15种方言离线语音输入

快速阅读: 据微信输入法消息,其iOS平台今日正式推送3.0.0版本,全面转向语音核心交互,新增15种方言自动识别、取消语音时长限制,并首次支持离线识别,同时强调数据本地处理以强化隐私保护。 微信输入法今日迎来重大升级,iOS平台正式推送3 […]

发布时间:2025年12月17日
腾讯成立AI Infra与Data部门强化大模型全链路能力

腾讯成立AI Infra与Data部门强化大模型全链路能力

快速阅读: 据腾讯消息,腾讯近日新设AI Infra部、AI Data部及数据计算平台部,全面强化大模型研发体系。此次调整将构建从算力基础设施到高质量数据处理的全链路能力,并由Vincesyao出任首席AI科学家,统筹关键技术攻关与业务落地 […]

发布时间:2025年12月17日