谷歌AI新突破:助力癌症治疗药物发现
快速阅读: 谷歌推出基于Gemma系列的AI工具C2S-Scale,成功提出癌症治疗新药物组合建议,并在实验室测试中表现良好,标志AI在科学领域的重大进展。
新德里——谷歌推出了一套人工智能(AI)工具,其研究人员报告称,这些工具不仅成功提出了癌症治疗的新药物组合建议,甚至在实验室早期测试中也表现良好。这一举动表明,研究科学家们应当将AI整合到科学发现的过程中。
这套工具建立在Gemma系列开放模型的基础上,Cell2Sentence-Scale 27B(C2S-Scale)是一个具有270亿参数的基础模型,旨在“理解”单个细胞的语言。
“此次宣布标志着AI在科学领域的一个里程碑。”谷歌DeepMind和谷歌研究的员工科学家Shekoofeh Azizi和Brian Perozzi在随附的帖子中表示。“C2S-Scale生成了一个关于癌症细胞行为的新假设,我们已经通过活细胞的实验验证确认了它的预测。这一发现揭示了开发抗癌疗法的一条有希望的新途径。”他们补充道。
一种新颖的应用
C2S-Scale模型是在大量真实患者和细胞系数据上训练而成的,据此它建议药物silmitasertib可用于提高免疫系统在肿瘤初期识别癌变肿瘤的能力。
确实,silmitasertib(CX-4945)目前正在进行多项临床试验,以治疗多发性骨髓瘤、肾癌、髓母细胞瘤和晚期实体肿瘤。2017年1月,美国食品药品监督管理局授予该药物用于治疗晚期胆管癌的孤儿药资格。
然而,谷歌此次努力的新颖之处并不在于(重新)发现这种药物,而在于它扫描了庞大的癌症生物学文献,提出了一种药物候选物的新用途。制药公司通常会花费数十亿美元并雇用高度训练的人员来揭示类似的见解。
“这是一个很好的成果,选择的问题很好地测试了大型语言模型(LLM)的能力。”班加罗尔干细胞科学与再生医学研究所的系统生物学家Sunil Laxman在接受《印度教徒报》采访时说。“通常情况下,这需要一支专注的研究团队花费数月时间才能提出这样的药物使用建议。”
“非常好”
不过,Laxman博士指出,模型并没有提出一个训练有素的生物学家想不到的建议,也没有发现有关癌症生物学的新知识。“非常好,但不是非常出色。印度的普通实验室无法获得大量的化学化合物库来进行测试。这个模型确实在某种程度上缩短了潜在发现的时间,但这并不是一个突破性的发现。”
大型语言模型(LLM)是AI的核心,它们通过人类标注的数据进行训练,以理解和解决人类语言中的问题。
Azizi博士和Perozzi博士认为,他们的结果证明,可以创建不需要基于生物系统规则训练的LLM。相反,这些模型可以通过对其成功进行‘奖励’和失败进行‘惩罚’的方式被鼓励找出规则。这是训练一些最强大的国际象棋LLM的方法之一。
良好的推理能力
班加罗尔印度科学研究所的数学教授Siddhartha Gadgil将这些发现解读为重要的,并认为当前最好的AI数学模型处于“熟练数学家而非天才水平”。
他说,没有理由认为AI的发展有一天不能解决最具挑战性的数学问题。“我们不能说一个AI模型何时能解决黎曼假设,但没有理由认为它永远不可能。已经有一些项目和公司正在解决未解的数学问题,并提出了新的假设。”
Gadgil博士提到,OpenAI(ChatGPT的制造商)在2025年国际数学奥林匹克竞赛中使用的“实验推理模型”,如果是一个人的话,该模型解答的问题足以赢得金牌。该模型遵循了与人类参赛者相同的时间限制。
值得注意的是,奥林匹克竞赛的问题并不是专业数学家工作的代表性例子;它们是为有天赋的高中生设计的,构成了数学才能的黄金标准测试。而黎曼假设则是许多数学家正在研究的问题,它关于质数的本质,一个多世纪以来一直未被证明。美国克雷数学研究所承诺,将向解决这个问题的人提供100万美元的奖金。
“仍然存在分歧”
鉴于这些大型语言模型接触的大量文献,它们有望提出新颖且有用的想法来解决数学问题,这些想法是同等水平的人类专家未必能立即想到的。Gadgil教授在其研究中积极采用大型语言模型工具,他补充说,他的领域对于是否将这些工具纳入研究仍存在分歧。他认为,有几种优秀的模型“尚未显示出停滞的迹象,且具备许多尚未完全开发的潜在能力”,因此应该鼓励研究人员将其作为工作中的工具加以利用。
(以上内容均由Ai生成)