用于甲状腺癌诊断的 AI 模型，准确率超过 90%，缩短了咨询准备时间

发布时间：2025年4月26日来源：szf

快速阅读: 据《科学日报》最新报道，研究团队开发了一种AI工具，利用大型语言模型自动解析甲状腺癌临床文件，准确率高且保护隐私。该工具在分期和风险分类上表现优异，有望提高临床效率。未来将在真实患者数据上进一步验证，以推广临床应用。

甲状腺癌是香港及全球范围内最常见的癌症类型之一。对这种疾病的精确管理通常依赖于两种系统：（1）美国癌症联合委员会（AJCC）或肿瘤-淋巴结-转移（TNM）分期系统，用于确定癌症分期；以及（2）美国甲状腺协会（ATA）的风险分类系统，用于划分癌症风险。这些系统对于预测患者生存率和指导治疗方案选择至关重要。然而，手动整合复杂的临床信息到这些系统中可能既耗时又低效。

研究团队研发了一款AI辅助工具，借助大型语言模型（LLMs），例如ChatGPT和DeepSeek，这些模型旨在理解并处理人类语言，用于分析临床文件，提升甲状腺癌分期和风险分类的准确性和效率。该模型运用四个离线开源LLMs——Mistral（Mistral AI）、Llama（Meta）、Gemma（Google）以及Qwen（阿里巴巴）——解析自由格式的临床文档。AI模型在美国公开可用的数据集上进行了训练，其中包括来自癌症基因组图谱计划（TCGA）的50名甲状腺癌患者的病理报告，并通过289名TCGA患者的病理报告以及内分泌外科医生创建的35例虚拟病例进行验证。通过融合四个LLMs的输出，研究团队提升了AI模型的整体性能，在ATA风险分类上的准确率达到88.5%至100%，在AJCC癌症分期上的准确率达到92.9%至98.1%。与传统的人工文件审阅相比，这一改进有望让临床医生在预咨询准备阶段节省一半时间。

香港大学公共卫生学院的吴祖泽教授指出该模型表现出色。“我们的模型在AJCC癌症分期和ATA风险类别分类上达到90%以上的准确度”，他说，“该模型的一大亮点在于其离线运行能力，这使得本地部署成为可能，而无需共享或上传敏感的患者信息，从而最大程度保障患者隐私。”

“鉴于DeepSeek最近的推出，我们采用‘零样本’方法进一步测试了其最新版本R1、V3以及GPT-4o的表现。我们欣喜地发现，我们的模型与这些强大的在线LLMs表现不相上下”，吴教授补充道。

香港大学临床医学院外科系临床助理教授兼内分泌外科主任方文谦博士表示：“不仅在从复杂的病理报告、手术记录和临床笔记中提取和分析信息方面高度准确，我们的AI模型还比人工解读快将近一倍。它能同时依据两个国际公认的临床体系提供癌症分期和临床风险分层。”

“该AI模型功能多样，可轻松融入公共和私营部门，以及本地和国际医疗保健与研究机构的各类场景”，方博士说，“我们相信，该AI模型的实际应用将有助于提升一线临床医生的工作效率并改善医疗服务品质。此外，医生将有更多时间与患者沟通。”

“顺应政府在医疗领域大力推动AI应用的趋势，正如医院管理局近期推出的基于LLM的医疗报告生成系统所示，下一步我们将用大量真实患者数据评估这款AI助手的性能。一旦验证成功，AI模型即可投入实际临床环境和医院使用，助力临床医生提升运营效率和治疗效果”，临床医学学院家庭医学与初级保健系荣誉副教授兼InnoHK D24H高级研究总监黄敬豪博士解释道。

这项研究由公共卫生学院Sir Robert Kotewall公共卫生学教授、InnoHK D24H董事总经理兼首席科学家吴祖杰教授领导，外科系内分泌外科主任方文谦博士，以及临床医学学院家庭医学与初级保健系荣誉副教授兼InnoHK D24H高级研究总监黄敬豪博士共同完成，均隶属于香港大学医学院。第一作者为InnoHK D24H的唐浩民博士和吴婷婷博士。

(以上内容均由Ai生成)