生物学中的 AI:AI 遇见内在无序蛋白质
快速阅读: 据《心灵很重要》最新报道,《大西洋》杂志与谷歌合作推出《对话:人工智能、社会与未来》专刊,聚焦人工智能对社会的影响及未来发展。专刊倾向于颂扬人工智能的优点,忽视其局限性。文章以AI驱动的药物发现为例,指出人工智能在蛋白质折叠预测领域的进展虽受瞩目,但其局限性不容忽视,过度乐观的宣传可能误导公众。
《大西洋》杂志的创意营销工作室Re:think现在推出了一整期关于人工智能带来的变化以及未来可能的发展。这本名为《对话:人工智能、社会与未来》的杂志,由科技巨头谷歌合作制作。正如你所期望的,在这种合作关系中,它更多地是在颂扬人工智能的优点,而不是警告读者其局限性。在最新一期——《对话》每季度出版一次——的介绍中,编辑指出,“目前关于人工智能崛起的大部分讨论可以归类为两种方式之一:无批判的乐观主义或反乌托邦式的恐惧。”确实如此。而且,我们怀疑,《对话》的观点是:“真相往往位于中间——而真相更有趣。”对于Re:think和谷歌来说,问题在于新出版物中的文章往往偏向乐观。用“吹鼓手”这个词来形容再合适不过了。以本期的特色文章《AI驱动的药物发现未来》为例。我不是生物学家,更不用说结构生物学家了,但作为一名专注于自然语言处理(NLP)的计算机科学家,我对人工智能与生物学的交叉领域感兴趣。我认识的一位朋友、同事和前教授将他的职业生涯致力于理解生物学中还原论机制的局限性。他最初引导我关注深度神经网络系统预测蛋白质折叠的大胆声明。从那时起,我就被深深吸引。因此,当新版《对话》在《大西洋》杂志的印刷版中宣传自己时,我读到了“真相位于中间”的口号,并期待得到对人工智能在复杂蛋白质折叠问题上的成功与失败的细致观点。我没有得到这样的内容。阅读《对话》让我想起了梅雷迪思·布劳萨德在其著作《人工智能无能:计算机如何误解世界》(麻省理工学院出版社2018年)中讨论的内容。布劳萨德认为,人工智能经常被吹捧为奇迹解决方案——一种能够取代人类专业知识、自动化复杂任务并以科学精度提供结果的工具。实际上,人工智能受到其训练数据限制的深刻制约,在蛋白质折叠预测的世界里这一点尤为明显。尽管人工智能炒作周期可能会让我们相信,生物学中的难题并不突然变得容易解决。《对话》不仅夸大了积极方面并吹嘘未来的可能性,还很大程度上忽略了严重的局限性。那么,让我们来看看现实。蛋白质折叠问题是生命的基石,执行着细胞内各种各样的功能。它们的功能依赖于三维结构,这些结构由氨基酸序列的折叠形成。蛋白质到达其功能性形状的过程被称为蛋白质折叠,数十年来,这一直是生物学中最复杂的未解之谜之一。科学家们试图通过氨基酸序列预测蛋白质结构——这就是所谓的“蛋白质折叠问题”。蛋白质折叠问题蛋白质折叠前后对比/公共领域。多年来,实验技术如X射线晶体学和冷冻电子显微镜(冷冻电镜)是唯一可靠的确定蛋白质结构的方法。虽然这些方法非常准确,但也缓慢、昂贵且劳动密集。可以说,实验室技术的成功推动了现代生物学的发展,但也迫使科学家和技术人员陷入了一种需要数年才能完成的繁琐仪式。然而,这些方法还是相当巧妙的。例如,X射线晶体学。这里的目标蛋白被纯化并诱导形成晶体结构,这一过程可能需要几周、几个月甚至几年的时间。并非所有蛋白质都配合——有些蛋白质根本拒绝结晶,使得它们几乎对这种方法隐形。但对于那些成功的,结果可能是惊人的。一旦结晶,样品会被高能X射线轰击,然后分析衍射图案以重建分子的原子排列。X射线晶体学在20世纪50年代曾用于帮助揭示DNA的双螺旋结构,这一成就彻底改变了我们对遗传学的理解。自那以后,晶体学照亮了无数生物分子的结构,从酶到病毒蛋白,奠定了现代分子生物学的基础。冷冻电子显微镜(冷冻电镜)同样耗时费力——但结果同样令人印象深刻。不同于强迫蛋白质进入晶体格,冷冻电镜涉及在极低温度下迅速冻结溶液中的蛋白质——这一过程将其锁定在位置上同时保持其自然形态。然后,样品被电子束轰击,数千个二维图像通过计算组合生成三维模型。与X射线晶体学不同,冷冻电镜不需要结晶,使其成为研究抵抗晶体学刚性约束或存在多种构象的蛋白质的重要工具。然而,冷冻电镜也有其局限性。尽管其分辨率大幅提高——其发明者因此获得了2017年的诺贝尔化学奖——该方法仍然技术上具有挑战性和昂贵。产生的图像是成千上万个分子快照的平均值,这意味着对于高度灵活的蛋白质,最终结构可能是模糊或不完整的。此外,某些类型的蛋白质仍然难以捉摸,解释冷冻电镜数据需要大量专业知识,使其不如爱好者所建议的那样是一种即时解决方案。可以肯定的是,X射线晶体学和冷冻电镜是结构生物学家工具箱中不可或缺的工具。它们数十年来一直是细胞生物学的一部分,使研究人员能够以惊人的精确度绘制生命分子机器的架构。DNA的双螺旋结构、血红蛋白的原子细节、设计疫苗所需的病毒结构——所有这些发现都依赖于这些方法。然而,尽管它们强大,这两种技术都有其局限性。X射线晶体学要求蛋白质被诱导成晶体形式,这一过程可能需要数月甚至数年时间,不是所有蛋白质都能很好地结晶。冷冻电镜虽然更为宽容,但仍需精心努力、昂贵设备和专家解读以解析复杂的分子组装。最近,更快的计算方法占据了中心舞台——带来了与兴奋一样多的困惑。像AlphaFold这样由谷歌DeepMind开发的人工智能驱动方法的成功被誉为蛋白质折叠预测的革命。人工智能支持者和《对话》等出版物将AlphaFold视为转折点,一个突破,可以极大地加速蛋白质结构发现,将曾经以年为单位的时间尺度缩短到仅仅几个小时。但是,正如人工智能叙事中经常发生的那样,现实更加复杂。接下来:机器崛起真正带来了什么改变?
(以上内容均由Ai生成)