人工智能“心智”脆弱,技术局限性引关注
快速阅读: 研究人员在《JAMA Network Open》发表研究,探讨大型语言模型是否具备推理能力。研究从医学执照考试中抽取问题,将正确答案替换为“以上都不是”,由临床医生审核确认。
研究人员在《JAMA Network Open》上发表了一项研究,探讨大型语言模型是否真正具备推理能力,还是仅仅识别模式。他们从医学执照考试的标准基准中抽取了问题。每个问题原本只有一个正确答案。在修改后的版本中,正确答案被移除,并替换为“以上都不是”(NOTA)。临床医生审查了每一个替换,确认所有可见选项确实都是错误的,从而使NOTA成为唯一正确答案。
(以上内容均由Ai生成)