生命时钟预测疾病,AI提前揭示健康风险
快速阅读: 科学家开发出覆盖全生命周期的生物钟模型“LifeClock”,能预测疾病风险,区分儿科发育与成人衰老的生物节奏,为精准医疗提供低成本工具。
科学家利用基于变换器的人工智能技术,开发了一种覆盖整个生命周期的生物钟模型,该模型能够预测未来的疾病风险,并揭示生长和衰老的不同生物节奏。
研究:《基于常规临床数据的全生命周期生物钟及其在健康和疾病中的影响》。图片来源:vectorfusionart / Shutterstock
近期发表在《自然医学》杂志上的一项研究中,研究人员描述并验证了一个新的人工智能(AI)模型,该模型通过分析日常电子健康记录(EHR),来确定人在整个生命过程中的生物学年龄。
该模型被命名为“LifeClock”,它识别出两个独立的生物钟,一个是儿科发育时钟,另一个是成人衰老时钟。这个模型可以在疾病发生前几年就预测出重大疾病的发病风险。这一框架提供了一种强大的低成本工具,有助于推进精准健康、可及性和个性化医疗的发展。
背景
长期以来,人们一直以生理年龄——即一个人活了多少年——作为评估个体慢性非传染性疾病风险的标准。然而,现代研究越来越关注生物学年龄(BA),这是衡量身体累积损伤和功能衰退程度的一个指标,相对于平均值而言。
研究表明,后者作为疾病风险和死亡率的预测指标更为准确。因为即使是同一年龄的两个人,由于遗传和生活方式的组合,其健康状况也可能大相径庭。
早期估计BA的方法依赖于复杂的、昂贵的分子数据(例如DNA甲基化模式)。尽管这些“衰老时钟”非常有效,但它们的应用范围往往有限。研究中的一个重要空白是缺乏一个能够覆盖整个人类生命周期的生物钟,特别是婴儿和儿童的关键发展阶段。在这些时期内发生的生理变化被认为是脚本化的发育,而非与衰老相关的损害。
因此,研究旨在寻找一种更便捷的方式来从出生开始监测健康轨迹,使用广泛可用的数据,如电子健康记录(EHR)。
研究概述
本研究填补了这一知识空白,介绍了名为“LifeClock”的生物钟模型。该模型基于一个强大的变换器型人工智能模型EHRFormer构建,该模型采用输入-输出双重随机掩码处理稀疏数据,对抗训练消除批次效应,并采用自回归设计进行纵向预测。
该模型的训练数据来自中国健康老龄化调查(CHAI)项目,包括来自960万独特个体的2460万次纵向临床访问数据。这些纵向数据跟踪了患者的健康状况,涵盖了184项常规临床指标,如实验室检测结果和生命体征。
EHRFormer模型通过分析临床访问序列及其关联的常规EHR记录,创建了健康的“数字表示”。该模型架构包括解决医疗数据常见挑战的复杂策略,如缺失值的插补和批次效应(医院或设备之间的差异)的消除。模型是在健康个体的数据上训练的,以建立正常发育和衰老的基线。
最后,研究在内部和外部数据集上评估了模型性能,包括英国生物银行,从而确保其预测结果在不同人群中具有稳健性和普遍性。
研究发现
研究分析显示存在两个独立且不同的生物钟:(1)18岁以下个体的“发育时钟”和(2)成年人的“衰老时钟”。针对每个阶段专门训练模型显著提高了预测准确性,突显了发育与衰老期间不同的生物学过程。
驱动这两个时钟的生物标志物几乎完全不同。儿科时钟受与生长相关的标记物强烈影响,如高肌酐和总蛋白水平。相比之下,成人时钟则由与年龄相关下降的指标驱动,包括高尿素、低白蛋白和高红细胞分布宽度(RDW)。
令人鼓舞的是,两个时钟在预测疾病风险方面都表现出色。儿科时钟准确地预测了未来营养不良、生长和发展异常(包括生长激素缺乏症)的风险。例如,对12岁以下儿童的EHR数据分析可以预测哪些个体在第14群组中患垂体功能亢进(风险高出15.36倍)和肥胖(风险高出11.07倍)的可能性更大。
成人时钟同样准确地预测了主要与年龄相关疾病的发病风险,包括2型糖尿病(T2D)。
研究表明,EHRFormer 模型能够显著识别出患有中风、肾衰竭和心血管疾病(CVD)的风险人群,某些群体的风险显著升高,例如,第 20 群体的肾衰竭风险比平均水平高出 37.7 倍。该模型不仅有助于诊断当前疾病,还能预测未来的健康风险。经过微调后,该模型在糖尿病诊断上的曲线下面积(AUC)达到 0.98,在预测未来糖尿病发病风险上达到 0.91。此外,EHRFormer 在这两项任务中均优于传统的 RNN 和 XGBoost 模型。
研究结论显示,通过常规、广泛可用且成本低廉的电子健康记录(EHR)数据,EHRFormer 能够构建一个强大的生物钟。LifeClock 提供了一种新的框架,用于理解儿童发育和成人衰老的不同过程。该模型超越了简单的生理年龄评估,提供了一个更加动态和精确的个人健康状况图景。通过提前数年识别出高风险个体,这项技术有望革新预防医学并指导个性化干预措施。
未来的研究可能涉及整合来自可穿戴设备和其他实时生物计量和健康数据源的信息,以创建一个更为适应性和准确的系统,促进健康老龄化。
参考文献:
王凯,刘飞,吴伟,胡超,沈鑫,王敏,李刚,曾凡,刘莉,黄毅宁,刘胜,邹志,李波,李静,黄晓,金松,李振,徐辉,陈光,陈曦.(2025)。基于常规临床数据的全生命周期生物钟及其在健康与疾病中的影响。《自然医学》。DOI – 10.1038/s41591-025-04006-w,https://www.nature.com/articles/s41591-025-04006-w
(以上内容均由Ai生成)