生成式 AI 的诊断能力可与非专科医生相媲美

发布时间：2025年4月20日来源：szf

快速阅读: 据《科学日报》最新报道，大阪都立大学研究团队发现，生成式AI（如ChatGPT）的医学诊断准确率（52.1%）低于专家（高15.8%），但接近非专科医生。研究建议扩大测试范围并提升透明度。成果已发表于《自然数字医学》。

大阪都立大学医学研究生院的高田广孝博士和上田大助教带领的研究团队，对2018年6月至2024年6月期间发表的涉及多领域医学研究的83篇论文进行了元分析，以评估生成式人工智能（AI）的诊断能力。在所分析的大语言模型（LLMs）中，ChatGPT是最常被研究的对象。比较评估结果显示，医学专家的诊断准确性比生成式AI高出15.8%。生成式AI的平均诊断准确率为52.1%，部分最新模型的准确性有时可以与非专科医生持平。

高田博士指出：“这项研究表明，生成式AI的诊断能力与非专科医生的水平相当。它可以用于医学教育，帮助非专科医生，并在医疗资源匮乏地区提供辅助诊断服务。”他还表示：“为了进一步验证AI的能力，我们需要开展更多研究，例如在更复杂的临床情境下进行评估、基于真实医疗记录的性能测试、提升AI决策的透明度以及在多样化的患者群体中进行验证。”

该研究结果已发表在《自然数字医学》上。

(以上内容均由Ai生成)