Meta研发新技术,揭示并修复大语言模型推理错误

发布时间:2025年10月31日    来源:szf
Meta研发新技术,揭示并修复大语言模型推理错误

快速阅读: Meta与爱丁堡大学合作开发CRV技术,能预测并修复LLM推理错误,通过观察模型内部“推理电路”,提高AI可靠性,为未来模型调试奠定基础。

近日,Meta 的人工智能研究团队与爱丁堡大学合作,开发了一种新技术,能够预测大型语言模型(LLM)推理的正确性,并在发现错误时进行修复。这种名为电路基础推理验证(CRV)的方法,旨在深入观察 LLM 的内部 “推理电路”,以便在模型解决问题时检测出计算错误的迹象。

研究表明,CRV 可以通过构建并观察模型内部激活的计算图,以高准确率检测到 LLM 的推理错误。这一突破性的发现意味着研究人员可以利用深层次的内部信息,对模型的错误推理进行针对性的干预。

链式思维推理(CoT)作为一种提升 LLM 在复杂任务上表现的方法,已经被广泛应用,但它的可靠性依然存在问题。现有的验证方法主要分为两类:“黑箱” 方法通过分析最终生成的 token 或置信度分数来验证;“灰箱” 方法则试图观察模型的内部状态,然而这些方法并不能解释计算失败的根本原因。

CRV 采用了一种 “白箱” 验证方法,认为模型在执行任务时会使用专门的神经元子图。通过替换标准的稠密层为训练过的 “转码器”,研究人员使目标 LLM 变得可解释,从而可以观察到其内部工作原理。接着,CRV 会构建一个 “归因图”,映射信息在模型各个部分之间的因果流动,并提取出描述图特性的 “结构指纹”。最终,训练一个 “诊断分类器” 来预测推理步骤是否正确。

研究团队在 Llama3.1模型上进行了实验,结果表明,CRV 在各种数据集和指标上均优于其他验证方法,展现了其强大的有效性。同时,研究发现,不同推理任务中的错误签名具有领域特异性,这意味着不同类型的推理依赖于不同的内部电路。

最重要的是,CRV 不仅仅是相关性分析,它提供了一种透明的计算视图,使得预测的失败可以追溯到特定组件,研究人员因此可以通过抑制错误特征,实时修正模型的推理路径。

划重点: 🌟 CRV 技术能有效预测并修复 LLM 的推理错误,提高 AI 的可靠性。

🧠 研究采用了 “白箱” 验证方法,揭示了 LLM 的内部推理电路。

🔧 CRV 的成功应用为未来 AI 模型调试工具的开发奠定了基础。

(以上内容均由Ai生成)

你可能还想读

特斯拉推出FSD体验活动,乘客可与Grok AI互动

特斯拉推出FSD体验活动,乘客可与Grok AI互动

快速阅读: 特斯拉举办活动,参与者可体验最新监督版全自动驾驶功能、舒适设置及车内娱乐系统,同时与Grok人工智能互动,享受问答和故事讲述服务。 根据特斯拉官方骑行网站,本次活动将让参与者坐在驾驶座上,而特斯拉顾问则作为副驾陪同。特斯拉顾问将 […]

发布时间:2025年11月2日
AI生成《老友记》短剧令人不安

AI生成《老友记》短剧令人不安

快速阅读: 一段AI生成的《老友记》视频网上疯传,角色变形、动作异常,尽管声音逼真但台词僵硬,引发广泛质疑,突显AI视频生成技术缺陷。 本周,一段关于经典情景喜剧《老友记》的AI生成视频在网上疯传,其诡异程度令人难以观看。尽管场景看起来基本 […]

发布时间:2025年11月2日
汤森路透加速AI战略,打造开放式AI平台与智能助手

汤森路透加速AI战略,打造开放式AI平台与智能助手

快速阅读: 路透社拥有26,000名员工,通过构建“开放竞技场”平台推广AI技术,已收购8家公司加强AI基础,推出法律深度研究助理等产品,积极应对文化转型挑战,看好AI长期潜力。 路透社去年6月报道,拥有明显人工智能战略的组织比没有此类战略 […]

发布时间:2025年11月2日
帕兰蒂尔AI平台助力业务增长,股价预期超越2026年目标

帕兰蒂尔AI平台助力业务增长,股价预期超越2026年目标

快速阅读: 帕兰提尔AIP平台帮助企业轻松集成大型语言模型,降低学习难度,拓展应用机会;同时,帕兰提尔扩大政府合作,获100亿美元美军合同。 帕兰提尔的人工智能平台(AIP)显著增强了其成果,该平台允许企业在软件中添加大型语言模型,并通过自 […]

发布时间:2025年11月2日
三星联手英伟达打造AI超级工厂,革新芯片生产

三星联手英伟达打造AI超级工厂,革新芯片生产

快速阅读: 三星电子与英伟达合作,建立人工智能超级工厂,集成AI于半导体设计、加工、设备控制和质量保证,使用50,000个英伟达GPU,旨在优化制造条件,提高生产效率和芯片产量。 台北(台湾),11月1日(ANI):三星电子周五宣布,将与美 […]

发布时间:2025年11月2日
谷歌确认AI搜索将含广告,形式或将变化

谷歌确认AI搜索将含广告,形式或将变化

快速阅读: 谷歌确认广告业务将持续存在并随AI技术发展而变化,计划在AI模式中融合个性化广告,如通过图片搜索相似产品或提供定制化餐饮建议。 谷歌广告不会消失。最终,谷歌及其可能的其他平台上的AI搜索结果将包含广告。谷歌最近报告称,从搜索引擎 […]

发布时间:2025年11月2日
警惕冒牌ChatGPT应用重返App Store榜单

警惕冒牌ChatGPT应用重返App Store榜单

快速阅读: 安全研究员发现两款模仿OpenAI品牌的AI聊天机器人应用,在Mac App Store上排名靠前,出自同一巴基斯坦开发者之手,提醒用户注意隐私风险。 两年前,OpenAI的GPT-4 API在App Store上迅速走红。很快 […]

发布时间:2025年11月1日
Reddit营收激增68%,AI助力利润飙升443%

Reddit营收激增68%,AI助力利润飙升443%

快速阅读: 2025年10月30日,Reddit宣布财务成果显著,销售额增长68%,DAU增至1.16亿,净利润激增443%至1.63亿美元。AI技术助力增长,公司加大海外营销投入。 2025年10月30日,热门在线社交和论坛平台Reddi […]

发布时间:2025年11月1日