Google 的 AlphaGenome AI 使 DNA 可读 — 而且在 GitHub 上

发布时间:2025年6月26日    来源:szf
Google 的 AlphaGenome AI 使 DNA 可读 — 而且在 GitHub 上

快速阅读: 据《解密》称,谷歌AlphaGenome可处理100万碱基对,46项测试优于旧模型,仅4.5亿参数,助力疾病研究与个性化医疗。它通过API开放,推动基因组学进入新阶段。

简而言之,AlphaGenome一次可处理多达100万个碱基对,在50项监管和变异预测的基准测试中,有46项超越了旧模型。AlphaGenome仅使用4.5亿个参数,其轻量级U-Net变压器解码非编码基因组,使疾病研究和个性化医疗成为可能。谷歌的模型可通过API提供给研究人员,标志着基因组学进入了一个更加开放和可获取的新时代。

Decrypt的艺术、时尚与娱乐中心。发现SCENE。

谷歌DeepMind今天宣布的AlphaGenome不仅仅是在科学AI军备竞赛中的又一个新成员。通过提供非商业用途的API访问权限,并在GitHub上托管详尽的文档和社区支持,这表明基因组学,曾经局限于专业实验室和付费数据集,正迅速向开放科学迈进。这是一件大事。

想象一下,你的DNA就像一本庞大的操作手册,告诉你身体如何运作。长期以来,科学家们只能真正理解那些直接告诉你的身体如何构建东西的部分,比如蛋白质。但你DNA的大部分——超过90%——并不是这样。它并不直接参与构建任何东西。人们曾称之为“垃圾DNA”。现在我们知道,“垃圾”实际上在做一件重要的事情:它控制着真正指令何时何地被使用——有点像一个充满开关和旋钮的控制面板。问题是,它真的很难阅读和理解。这就是AlphaGenome的作用。

AlphaGenome是由谷歌DeepMind开发的强大AI模型,它可以比以往任何模型更好地阅读这些令人困惑的DNA部分。它使用先进的机器学习(如图像生成器或聊天机器人背后的那种)来查看大段DNA——长达一百万个字母长——并找出哪些部分是重要的,它们如何影响你的基因,甚至突变如何导致疾病。这就像拥有一台超级智能的AI显微镜,不仅能够阅读手册,还能弄清楚整个系统如何开启和关闭,以及当事情出错时会发生什么。

有趣的是,DeepMind通过API(一种让计算机与其进行交互的方式)分享了这个工具,因此世界各地的科学家和医学研究人员可以免费在他们的研究中使用它。这意味着它可能加速遗传病、个性化医疗乃至抗衰老治疗的研究进展。

总之:AlphaGenome帮助科学家解读我们之前无法理解的DNA部分——这可能会改变我们治疗疾病的方式。

AlphaGenome是一种深度学习模型,旨在分析DNA序列如何调控基因表达和其他关键功能。与以往解析短DNA片段的模型不同,AlphaGenome可以处理长达一百万个碱基对的序列——前所未有的规模,使其能够捕捉到以前方法所遗漏的远距离调节相互作用。

AlphaGenome的核心优势是其多模态预测系统。与以前只能预测一种基因组活动的模型不同,该模型可以输出高分辨率的基因表达预测(RNA-seq、CAGE)、剪接事件、染色质状态(包括DNase敏感性和组蛋白修饰)以及3D染色质接触图谱。这不仅能精准定位细胞中哪些基因处于开启或关闭状态,而且有助于理解基因组折叠、编辑和可及性的复杂编排。

该架构值得注意,但如果你曾经使用过Stable Diffusion或本地的普通开源大语言模型,那么它仍然相当熟悉:AlphaGenome使用了一种受U-Net启发的神经网络,约有4.5亿个可训练参数。是的,这个参数量确实相对较低,如果将其与即使是较弱且较小的语言模型进行比较,因为这些模型通常处理数十亿个参数。然而,考虑到DNA只涉及4种碱基和两种配对——基本上整个人类基因组不过是A-T和C-G配对的组合——这是一个非常具体的模型,专门设计得极为出色。

该模型包含一个序列编码器,将输入从单碱基分辨率下采样到更粗略的表示,然后由变压器模型层处理长距离依赖关系,最后由解码器将输出重建为单碱基级别的信息。这使得可以在各种分辨率下进行预测,允许进行精细和广泛的调控分析。

该模型的训练依赖于大量公开可用的数据集,包括ENCODE、GTEx、4D Nucleome和FANTOM5——这些资源涵盖了人类和小鼠多种细胞类型的大量实验数据。而且这一过程也相当快:使用谷歌定制的TPU,DeepMind仅用四小时就完成了预训练和蒸馏过程,所使用的计算资源仅为前代模型Enformer的一半。

AlphaGenome在24项序列预测测试中的22项和26项变异效应预测中的24项中表现优于最先进的模型,在通常只有渐进式改进的基准测试中,这是罕见的全面领先。事实上,它做得如此出色,以至于它可以比较突变和未突变的DNA,几秒钟内预测基因变异的影响——这对研究疾病起源的科学家而言是一项关键工具。

这很重要,因为非编码基因组包含了许多控制细胞功能和疾病风险的调节开关。像AlphaGenome这样的模型正在揭示人类生物学中有多少是由这些以前不透明的区域所支配的。

如今,人工智能对生物学的影响已不容忽视。以安克(Ankh)为例,这是一种由慕尼黑工业大学、哥伦比亚大学和初创公司Protinea团队开发的蛋白质语言模型。Ankh将蛋白质序列视为语言,生成新蛋白质并预测其行为——类似于AlphaGenome翻译DNA的调控“语法”。

另一项相关技术,英伟达的GenSLMs,展示了人工智能预测病毒突变和聚类基因变异的能力,用于疫情研究。同时,利用人工智能推动化学和基因相关抗衰老干预措施的发展,凸显了基因组学、机器学习和医学的交汇点。

AlphaGenome最重要的贡献之一是它的可及性。该模型并非仅用于商业用途,而是通过公共API提供给非商业研究。

尽管目前尚未完全开源——意味着研究人员还不能下载并本地运行或修改它——但API和配套资源使全球科学家均可生成预测,适应不同物种或细胞类型的分析,并提供反馈以优化未来版本。DeepMind已表示未来将进行更广泛的开源发布。

AlphaGenome分析非编码变异的能力——大多数与疾病相关的突变都出现在这里——可能有助于揭示遗传疾病和罕见疾病的全新机制。其高速变异评分也有助于个性化医疗,其中治疗方法是根据个体独特的DNA特征量身定制的。

目前,非编码基因组不再是一个黑箱,而人工智能在基因组学中的作用将持续扩大。AlphaGenome可能不是引领我们进入赫胥黎《美丽新世界》的模型,但它明确表明了事物的发展方向:更多的数据、更好的预测,以及对生命如何运作的更深入理解。

普遍智能 通讯 每周AI之旅,由生成式AI模型Gen讲述。您的邮箱 获取!

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日