Meta发布CoT-Verifier，AI推理错误无处遁形

发布时间：2025年11月28日来源：szf

快速阅读: Meta AI发布CoT-Verifier，新模型可在Hugging Face获取，旨在解析链式思维每步“电路轨迹”，提高错误检测精度，通过图特征训练分类器，实现推理纠错从“事后分析”到“实时导航”的转变。

Meta AI实验室今日宣布将Llama3.1升级为推理“X光机”——新模型CoT-Verifier现已上线Hugging Face，旨在解析链式思维（CoT）每一步的“电路轨迹”，使错误无所遁形。传统的验证方法仅关注输出结果是否正确，而Meta采取了全新的视角：首先让模型运行一次前向传播，然后提取每一步的归因图。研究团队发现，正确与错误推理的图结构差异显著，如同两种截然不同的电路板。通过在这些“图特征”上训练轻量级分类器，错误步骤的预测准确率达到了行业领先水平，而且不同任务（如数学、逻辑、常识）展现出各自的“故障图谱”，表明推理失败不是随机噪声，而是具有可量化和分类的计算模式。

更重要的是，归因图不仅能够“诊断”问题，还能够“治疗”。Meta通过实验对高度可疑的节点进行定向消融或权重偏移，成功将Llama3.1在MATH数据集上的准确率提升了4.2个百分点，无需重新训练主干网络。这意味着，CoT-Verifier将推理纠错从“事后分析”转变为“实时导航”。

该模型已经开源，支持一键复现。开发者只需将待验证的CoT路径输入Verifier，即可获得每一步的“结构异常分数”，并准确定位最有可能出错的上游节点。Meta在论文中表示，未来计划将这种图干预的方法应用于代码生成和多模态推理，使“白盒手术”成为大型语言模型的新标准。

(以上内容均由Ai生成)