Google DeepMind 发布 TxGemma 以加速药物开发
快速阅读: 《印度分析杂志》消息,谷歌DeepMind发布TxGemma,一套基于生物医学数据优化的开源语言模型套件,可提升药物开发效率。TxGemma提供三种规模模型,并包含支持微调工具和Agentic-Tx协调系统,已在多种基准测试中表现出色,鼓励研究社区进一步探索其潜力。
深度思维(隶属于谷歌)发布了TxGemma,这是一套旨在助力治疗性开发的新开源语言模型套件。这些模型通过将大型语言模型的能力应用于生物医学数据,旨在提升药物候选评估、分子属性预测和临床试验结果估计等任务。TxGemma可通过Vertex AI模型花园和Hugging Face获取。谷歌深度思维邀请研究社区对这些模型进行实验,使用专有数据进行微调,并分享结果。
TxGemma基于Gemma家族模型构建,并是Tx-LLM的继承者,后者于2024年10月推出。它在700万个示例上进行了训练,提供三种规模:2B、9B和27B。每个版本都包含一个用于特定任务的“预测”模型,例如确定分子毒性,以及一个用于会话分析的“聊天”模型。
“TxGemma专门针对整个发现过程中的治疗实体属性进行理解和预测训练,”谷歌深度思维的研究科学家舍科芙·阿齐兹表示,“这可能缩短从实验室到病床的时间,并降低传统方法相关的成本。”
27B预测模型的表现优于或相当于前代Tx-LLM及专业模型,在66项基准测试中有45项表现更佳,在50项任务中达到了或超过了特定任务模型的水平。除了预测模型外,TxGemma还包括经过指令微调的基于聊天的版本,能够回答复杂的科学问题。这些版本帮助研究人员解释预测结果。例如,该模型可以根据分子结构解释毒性预测。
发布还包含支持微调的工具。使用TrialBench数据集的Colab笔记本演示了开发者如何将TxGemma适配于临床试验中的不良事件预测等任务。“微调使研究人员能够利用自有数据创建满足其独特研究需求的模型,”阿齐兹说。
深度思维推出了由Gemini 2.0 Pro驱动的协调系统Agentic-Tx,以扩大模型的应用范围。这个代理框架将TxGemma与18种工具整合为一体,包括搜索工具、基因和蛋白质参考以及分子分析模块,以处理生物学和化学中的多步推理任务。Agentic-Tx在ChemBench和Humanity’s Last Exam等高难度基准测试中表现优异。
另一份Colab笔记本演示了该系统如何管理复杂的治疗工作流。“我们期待看到社区如何借助TxGemma加速治疗性发现,”阿齐兹说。
(以上内容均由Ai生成)