开发和验证可解释的机器学习模型,以预测肌层浸润性膀胱癌患者的远处转移和预后
快速阅读: 据《Nature.com》最新报道,本研究构建了一个预测转移性MIBC患者总生存期的机器学习模型,确定“化疗”为最关键因素。通过多种验证,“随机森林+弹性网络[alpha=0.8]”模型展现出最佳性能和临床价值,优于其他模型。
为了构建一个用于预测转移性MIBC患者总生存期(OS)的精确模型,我们进行了单变量和多变量Cox分析。这些分析确定了“组织学”、“T分期”、“N分期”、“手术类型”、“淋巴结手术”、“化疗”、“肿瘤大小”、“骨转移”、“脑转移”、“肝转移”和“肺转移”为转移性MIBC患者OS的独立预后因素(P<0.05,表4)。基于识别出的临床变量,我们在留一交叉验证(LOOCV)框架内生成了101个预后机器学习(ML)组合。每个模型的C指数在训练集、内部验证集和外部验证集上进行了计算(图7A)。从所有数据集中选出C指数最高的前五个组合,我们通过对数损失、召回率和决策校准评估了模型性能,强调了“随机森林+弹性网络[alpha=0.8]”模型具有出色的校准能力和准确性(补充图1C)。最优模型是“随机森林+弹性网络[alpha=0.8]”,使用随机森林进行特征选择(图7B),并使用设置为0.8的弹性网络进行模型构建(图7C),在三个数据集中的平均C指数最高(0.679)(图7A)。从所有数据集中选出C指数最高的前五个组合,我们通过对数损失、召回率和决策校准评估了模型性能,强调了“随机森林+弹性网络[alpha=0.8]”模型具有出色的校准能力和准确性(补充图1C)。开发了一个预后机器学习模型“随机森林+弹性网络[alpha=0.8]”来预测转移性MIBC患者的OS,在随机森林和弹性网络[alpha=0.8]算法中确定“化疗”是最具影响力的因子(图7B、C)。根据弹性网络[alpha=0.8]计算的风险评分,我们将训练队列中的中位风险评分作为阈值,将患者划分为高风险组和低风险组。Kaplan-Meier(K-M)曲线验证了该模型在风险分层方面的有效性,显示低风险组患者的生存期显著长于高风险组,无论是在训练集、内部验证集还是外部验证集中(图7D)。此外,1年、3年和5年的OS ROC曲线展示了该模型极高的特异性(图7E)。时变ROC曲线显示,“随机森林+弹性网络[alpha=0.8]”模型在多数时间点的表现均优于其他模型,显示出比传统临床变量更高的区分度和预测能力(图7F)。校准曲线(图7G)与决策曲线(DCA曲线,图7H)进一步证明了该模型的精准度及其临床应用价值。结合上述各项评估指标可以得出结论,“随机森林+弹性网络[alpha=0.8]”模型为预测转移性MIBC患者OS提供了稳健且优越的工具,在可靠性及预测性能方面优于其他机器学习模型。
(以上内容均由Ai生成)