Google 的 AlphaGenome AI 使 DNA 可读 — 而且在 GitHub 上

发布时间:2025年6月26日    来源:szf
Google 的 AlphaGenome AI 使 DNA 可读 — 而且在 GitHub 上

快速阅读: 据《解密》称,谷歌AlphaGenome可处理100万碱基对,46项测试优于旧模型,仅4.5亿参数,助力疾病研究与个性化医疗。它通过API开放,推动基因组学进入新阶段。

简而言之,AlphaGenome一次可处理多达100万个碱基对,在50项监管和变异预测的基准测试中,有46项超越了旧模型。AlphaGenome仅使用4.5亿个参数,其轻量级U-Net变压器解码非编码基因组,使疾病研究和个性化医疗成为可能。谷歌的模型可通过API提供给研究人员,标志着基因组学进入了一个更加开放和可获取的新时代。

Decrypt的艺术、时尚与娱乐中心。发现SCENE。

谷歌DeepMind今天宣布的AlphaGenome不仅仅是在科学AI军备竞赛中的又一个新成员。通过提供非商业用途的API访问权限,并在GitHub上托管详尽的文档和社区支持,这表明基因组学,曾经局限于专业实验室和付费数据集,正迅速向开放科学迈进。这是一件大事。

想象一下,你的DNA就像一本庞大的操作手册,告诉你身体如何运作。长期以来,科学家们只能真正理解那些直接告诉你的身体如何构建东西的部分,比如蛋白质。但你DNA的大部分——超过90%——并不是这样。它并不直接参与构建任何东西。人们曾称之为“垃圾DNA”。现在我们知道,“垃圾”实际上在做一件重要的事情:它控制着真正指令何时何地被使用——有点像一个充满开关和旋钮的控制面板。问题是,它真的很难阅读和理解。这就是AlphaGenome的作用。

AlphaGenome是由谷歌DeepMind开发的强大AI模型,它可以比以往任何模型更好地阅读这些令人困惑的DNA部分。它使用先进的机器学习(如图像生成器或聊天机器人背后的那种)来查看大段DNA——长达一百万个字母长——并找出哪些部分是重要的,它们如何影响你的基因,甚至突变如何导致疾病。这就像拥有一台超级智能的AI显微镜,不仅能够阅读手册,还能弄清楚整个系统如何开启和关闭,以及当事情出错时会发生什么。

有趣的是,DeepMind通过API(一种让计算机与其进行交互的方式)分享了这个工具,因此世界各地的科学家和医学研究人员可以免费在他们的研究中使用它。这意味着它可能加速遗传病、个性化医疗乃至抗衰老治疗的研究进展。

总之:AlphaGenome帮助科学家解读我们之前无法理解的DNA部分——这可能会改变我们治疗疾病的方式。

AlphaGenome是一种深度学习模型,旨在分析DNA序列如何调控基因表达和其他关键功能。与以往解析短DNA片段的模型不同,AlphaGenome可以处理长达一百万个碱基对的序列——前所未有的规模,使其能够捕捉到以前方法所遗漏的远距离调节相互作用。

AlphaGenome的核心优势是其多模态预测系统。与以前只能预测一种基因组活动的模型不同,该模型可以输出高分辨率的基因表达预测(RNA-seq、CAGE)、剪接事件、染色质状态(包括DNase敏感性和组蛋白修饰)以及3D染色质接触图谱。这不仅能精准定位细胞中哪些基因处于开启或关闭状态,而且有助于理解基因组折叠、编辑和可及性的复杂编排。

该架构值得注意,但如果你曾经使用过Stable Diffusion或本地的普通开源大语言模型,那么它仍然相当熟悉:AlphaGenome使用了一种受U-Net启发的神经网络,约有4.5亿个可训练参数。是的,这个参数量确实相对较低,如果将其与即使是较弱且较小的语言模型进行比较,因为这些模型通常处理数十亿个参数。然而,考虑到DNA只涉及4种碱基和两种配对——基本上整个人类基因组不过是A-T和C-G配对的组合——这是一个非常具体的模型,专门设计得极为出色。

该模型包含一个序列编码器,将输入从单碱基分辨率下采样到更粗略的表示,然后由变压器模型层处理长距离依赖关系,最后由解码器将输出重建为单碱基级别的信息。这使得可以在各种分辨率下进行预测,允许进行精细和广泛的调控分析。

该模型的训练依赖于大量公开可用的数据集,包括ENCODE、GTEx、4D Nucleome和FANTOM5——这些资源涵盖了人类和小鼠多种细胞类型的大量实验数据。而且这一过程也相当快:使用谷歌定制的TPU,DeepMind仅用四小时就完成了预训练和蒸馏过程,所使用的计算资源仅为前代模型Enformer的一半。

AlphaGenome在24项序列预测测试中的22项和26项变异效应预测中的24项中表现优于最先进的模型,在通常只有渐进式改进的基准测试中,这是罕见的全面领先。事实上,它做得如此出色,以至于它可以比较突变和未突变的DNA,几秒钟内预测基因变异的影响——这对研究疾病起源的科学家而言是一项关键工具。

这很重要,因为非编码基因组包含了许多控制细胞功能和疾病风险的调节开关。像AlphaGenome这样的模型正在揭示人类生物学中有多少是由这些以前不透明的区域所支配的。

如今,人工智能对生物学的影响已不容忽视。以安克(Ankh)为例,这是一种由慕尼黑工业大学、哥伦比亚大学和初创公司Protinea团队开发的蛋白质语言模型。Ankh将蛋白质序列视为语言,生成新蛋白质并预测其行为——类似于AlphaGenome翻译DNA的调控“语法”。

另一项相关技术,英伟达的GenSLMs,展示了人工智能预测病毒突变和聚类基因变异的能力,用于疫情研究。同时,利用人工智能推动化学和基因相关抗衰老干预措施的发展,凸显了基因组学、机器学习和医学的交汇点。

AlphaGenome最重要的贡献之一是它的可及性。该模型并非仅用于商业用途,而是通过公共API提供给非商业研究。

尽管目前尚未完全开源——意味着研究人员还不能下载并本地运行或修改它——但API和配套资源使全球科学家均可生成预测,适应不同物种或细胞类型的分析,并提供反馈以优化未来版本。DeepMind已表示未来将进行更广泛的开源发布。

AlphaGenome分析非编码变异的能力——大多数与疾病相关的突变都出现在这里——可能有助于揭示遗传疾病和罕见疾病的全新机制。其高速变异评分也有助于个性化医疗,其中治疗方法是根据个体独特的DNA特征量身定制的。

目前,非编码基因组不再是一个黑箱,而人工智能在基因组学中的作用将持续扩大。AlphaGenome可能不是引领我们进入赫胥黎《美丽新世界》的模型,但它明确表明了事物的发展方向:更多的数据、更好的预测,以及对生命如何运作的更深入理解。

普遍智能 通讯 每周AI之旅,由生成式AI模型Gen讲述。您的邮箱 获取!

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日