AI 工具使基因研究更加全面
快速阅读: 据《科学日报》称,克莉莉·格莱姆博士领导的团队开发了PhyloFrame,一种利用人工智能解决基因数据中祖先多样性的工具,以改善精准医学。该方法通过整合大量基因组数据,提高疾病预测和治疗的准确性,不论患者祖先背景如何。相关论文已发表在《自然通讯》上。这项研究有望在临床中应用,为每个人提供个性化的治疗方案。
克莉莉·格莱姆博士领导的工作重点是通过解决“祖先偏差”问题来改善人类健康状况。这种偏差限制了精准医学的发展,并导致全球大部分人口在疾病治疗和预防方面得不到充分的服务。为了解决这个问题,团队开发了PhyloFrame,这是一种利用人工智能来考虑基因数据中祖先多样性的机器学习工具。在国立卫生研究院的资金支持下,目标是改进对每个人的疾病预测、诊断和治疗,无论其祖先背景如何。描述PhyloFrame方法及其在精准医学结果中显著改进的论文已于周一发表在《自然通讯》上。
格莱姆博士关注基因组数据中的祖先偏差的灵感源自与一位对其多样化患者群体的研究有限的相关性感到沮丧的医生的对话。这次经历促使她探索人工智能如何帮助缩小遗传学研究中的差距。“我想,‘我能解决这个问题,’”格莱姆说,她的研究集中在机器学习和精准医学,并且受过种群基因组学训练。“如果我们的训练数据与现实世界的数据不匹配,我们可以使用机器学习来解决这个问题。它们并不完美,但可以大大解决这个问题。”
通过利用来自种群基因组数据库gnomAD的数据,PhyloFrame整合了大量健康人类基因组数据库与用于训练精准医学模型的小型疾病特定数据集。它创建的模型更能应对多样的遗传背景。例如,它可以预测乳腺癌等疾病的亚型差异,并建议最适合每个患者的治疗方法,而不论患者祖先背景如何。
处理如此大量的数据并非易事。团队使用UF的HiPerGator超级计算机分析数百万人的基因信息。对于每个人来说,这意味着需要处理三十亿个DNA碱基对。“我没有想到它会像现在这样有效,”格莱姆说,她指出她的博士生莱斯利·史密斯对该研究做出了重大贡献。“从一个使用简单模型来展示纳入种群基因组数据影响的小项目开始,已经发展成争取资金以开发更复杂模型并细化种群定义的过程。”
PhyloFrame的独特之处在于它能够确保预测在不同人群中保持准确,通过考虑与祖先相关的遗传差异。这是至关重要的,因为大多数当前模型是基于不能完全代表世界人口的数据构建的。现有数据大多来自研究医院和信任医疗系统的患者。这意味着小城镇的人口或不信任医疗系统的人往往被排除在外,使得为所有人开发有效的治疗方法变得更加困难。她还估计97%的测序样本来自欧洲血统的人,这主要是由于国家和州级的资金和优先事项,但也受到不同层面的社会经济因素的影响——例如保险是否影响人们接受治疗,从而影响他们被测序的可能性。“一些其他国家,尤其是中国和日本,最近一直在尝试缩小这一差距,因此这些国家的数据比以前更多,但仍远不及欧洲的数据。”她说,“较贫穷的人口通常被完全排除在外。”
因此,训练数据的多样性至关重要,格莱姆说。“我们希望这些模型适用于任何患者,而不仅仅是我们的研究对象,”她说。“拥有多样化的训练数据可以使模型对欧洲人也更好。拥有种群基因组数据有助于防止模型过度拟合,这意味着它们将更好地适用于所有人,包括欧洲人。”
格莱姆相信像PhyloFrame这样的工具最终将在临床环境中得到应用,取代传统模型,根据个人的基因组成制定个性化治疗方案。团队下一步计划是完善PhyloFrame并扩大其应用于更多疾病。“我的梦想是通过这种机器学习方法推进精准医学,让人们能够及早诊断并接受专门针对他们的治疗方法,副作用最小,”她说。“在正确的时间将正确的治疗方法带给正确的人正是我们所追求的目标。”
格莱姆的项目获得了UF医学院研究办公室AI2 Datathon资助奖,旨在帮助研究人员和临床医生利用人工智能工具改善人类健康。
(以上内容均由Ai生成)