人工智能“心智”脆弱，技术局限性引关注

发布时间：2025年8月27日来源：szf

快速阅读: 研究人员在《JAMA Network Open》发表研究，探讨大型语言模型是否具备推理能力。研究从医学执照考试中抽取问题，将正确答案替换为“以上都不是”，由临床医生审核确认。

研究人员在《JAMA Network Open》上发表了一项研究，探讨大型语言模型是否真正具备推理能力，还是仅仅识别模式。他们从医学执照考试的标准基准中抽取了问题。每个问题原本只有一个正确答案。在修改后的版本中，正确答案被移除，并替换为“以上都不是”（NOTA）。临床医生审查了每一个替换，确认所有可见选项确实都是错误的，从而使NOTA成为唯一正确答案。

(以上内容均由Ai生成)