AACR 2025:现成的机器学习模型可以弥合全球皮肤癌护理中的诊断差距
快速阅读: 《药房时报》消息,研究显示,预训练机器学习模型在资源有限区域可提升非黑色素瘤皮肤癌诊断准确性,尤其适用于缺乏病理学专家的环境。宋盛团队评估三种基础模型后发现,它们的表现显著优于传统模型ResNet18,并开发了简化版本以降低资源需求。尽管存在局限性,但此研究为缩小全球癌症护理差距提供了路径。
在资源有限的区域,预训练的机器学习模型可能在诊断非黑色素瘤皮肤癌(NMSC)方面起到重要作用。2025年于伊利诺伊州芝加哥市举办的美国癌症研究协会(AACR)年会上,芝加哥大学医学博士/哲学博士候选人宋盛(音译)解释道,通过利用基础模型的强大能力——即大规模、通用的机器学习模型,这些模型经过大量数据的训练,他的研究团队展示了相较于传统方法更高的诊断准确性,尤其是在资源匮乏的环境中。
“在资源有限的情况下,缺乏病理学专家限制了及时和广泛审查与诊断NMSC的能力,”宋盛在AACR的声明中表示,“人工智能和机器学习长期以来承诺填补资源缺口,但定制机器学习模型的开发和部署需要大量的资源,而这些资源在许多地方可能无法获得——即计算专家、专门的计算硬件以及大量精心策划的数据来训练每个模型。”
为了解决诊断过程中的这一瓶颈,宋盛和他的同事探讨了是否可以将预训练模型——通常称为基础模型——以“开箱即用”的方式重新用于辅助NMSC诊断。据宋盛称,这些模型已经过大量数据的训练,并且被设计为能够在不同领域之间高效泛化。它们的使用消除了为每种临床应用从头开始开发新模型的需求,从而降低了在技术基础设施有限的环境中部署人工智能的障碍。
在他们的研究中,研究人员评估了三个著名的基础模型——PRISM、UNI和Prov-GigaPath——与广泛使用的图像识别架构ResNet18在孟加拉国维生素E和硒试验(BEST)的皮肤组织数字病理切片上的表现。据宋盛称,他的团队选择了BEST研究队列中的切片,因为孟加拉国NMSC的高发病率,这主要由长期接触砷污染的饮用水引起。
该数据集包括来自553个活检样本的2130张高分辨率数字图像。其中,1424张图像代表各种类型的NMSC——鲍温病、基底细胞癌和侵袭性鳞状细胞癌,而706张图像则为正常组织。每个基础模型通过对组织切片进行分割成更小的图像块、提取相关特征并评估癌组织存在的可能性来分析这些切片。基础模型的表现显著优于ResNet18模型。ResNet18在区分癌性和非癌性组织方面的准确度为80.5%。相比之下,PRISM达到了92.5%,UNI为91.3%,Prov-GigaPath为90.8%。这些结果凸显了预训练模型在病理学中的强大功能。
然而,宋盛的研究团队也认识到,即使这些模型比从头开始训练一个新模型更容易获取,但对于某些环境来说,它们仍然可能过于复杂或资源密集。为了使部署更加可行,他们为每个基础模型开发了简化版本,这些版本需要较少的数据处理。令人鼓舞的是,这些简化的版本仍然表现良好,分别达到了88.2%(PRISM)、86.5%(UNI)和85.5%(Prov-GigaPath)的准确度,再次超过了ResNet18的基准。
除了分类准确性之外,团队还引入了一种在数字切片上标注癌变区域的方法。这种方法不需要大量的训练数据;相反,它使用少量已标注的例子来帮助突出显示新图像中潜在的癌变区域。这种视觉辅助工具对于指导非专业病理学家的临床医生或技术人员在诊断过程中可能会非常有用。
从技术角度来看,这项研究采用了严格的评估框架,使用了5折交叉验证并比较了各种嵌入策略和分类器组合。例如,性能最佳的模型使用了PRISM嵌入并通过其内置的Perceiver网络聚合,并用浅层多层感知机进行分类,实现了0.925的ROC曲线下平均面积。即使是简单的分类器如逻辑回归,当结合基础模型嵌入的全局平均池化时也表现良好,这表明系统可以根据可用的计算资源灵活调整。
尽管取得了这些有希望的结果,作者承认存在局限性。最值得注意的是,该研究仅在一个孟加拉人群体中评估了这些模型。虽然这个队列非常适合研究NMSC,因为在这个人群中疾病发病率较高,但这些发现可能并不完全适用于具有不同遗传、环境或医疗保健特征的其他人群。
此外,尽管这项研究旨在满足资源匮乏环境的需求,但它并未直接解决现实世界部署的实际挑战,如滑动扫描硬件的可用性、互联网连接、融入现有临床工作流程以及用户培训的需求。
即便如此,这项工作揭示了一条实用路径,以缩小全球癌症护理中的健康差异。通过利用预训练的机器学习模型,有可能将高质量的诊断工具扩展到缺乏病理学家的社区。这项研究还指出了基础模型在医学领域的更广泛应用潜力,在那里,一个强大的模型可以通过相对较小的定制适应各种任务。
展望未来,还需要进一步的研究来验证这些模型在不同环境中的表现,并试点实际实施。关于这种方法的可持续性问题仍然存在,包括AI工具的维护和更新需求,以及如何最好地确保患者图像的数据隐私和伦理使用。
“虽然我们的研究表明基础模型作为资源高效的工具可以帮助NMSC诊断,但我们承认我们距离直接影响患者护理还有很长的路要走,”宋盛在AACR的声明中表示,“还需更多工作来解决实际问题,但潜力是真实存在的——并且前景广阔。”
参考文献:
预训练机器学习模型可能有助于在资源匮乏的环境中准确诊断非黑色素瘤皮肤癌。美国癌症研究协会。2025年4月28日。2025年4月25日访问。
https://aacr.ent.box.com/s/sm6x7i8w4l87qfhcrjtl877wodplhtrg
(以上内容均由Ai生成)