Google DeepMind 发布 TxGemma 以加速药物开发

发布时间：2025年4月14日来源：szf

快速阅读: 《印度分析杂志》消息，谷歌DeepMind发布TxGemma，一套基于生物医学数据优化的开源语言模型套件，可提升药物开发效率。TxGemma提供三种规模模型，并包含支持微调工具和Agentic-Tx协调系统，已在多种基准测试中表现出色，鼓励研究社区进一步探索其潜力。

深度思维（隶属于谷歌）发布了TxGemma，这是一套旨在助力治疗性开发的新开源语言模型套件。这些模型通过将大型语言模型的能力应用于生物医学数据，旨在提升药物候选评估、分子属性预测和临床试验结果估计等任务。TxGemma可通过Vertex AI模型花园和Hugging Face获取。谷歌深度思维邀请研究社区对这些模型进行实验，使用专有数据进行微调，并分享结果。

TxGemma基于Gemma家族模型构建，并是Tx-LLM的继承者，后者于2024年10月推出。它在700万个示例上进行了训练，提供三种规模：2B、9B和27B。每个版本都包含一个用于特定任务的“预测”模型，例如确定分子毒性，以及一个用于会话分析的“聊天”模型。

“TxGemma专门针对整个发现过程中的治疗实体属性进行理解和预测训练，”谷歌深度思维的研究科学家舍科芙·阿齐兹表示，“这可能缩短从实验室到病床的时间，并降低传统方法相关的成本。”

27B预测模型的表现优于或相当于前代Tx-LLM及专业模型，在66项基准测试中有45项表现更佳，在50项任务中达到了或超过了特定任务模型的水平。除了预测模型外，TxGemma还包括经过指令微调的基于聊天的版本，能够回答复杂的科学问题。这些版本帮助研究人员解释预测结果。例如，该模型可以根据分子结构解释毒性预测。

发布还包含支持微调的工具。使用TrialBench数据集的Colab笔记本演示了开发者如何将TxGemma适配于临床试验中的不良事件预测等任务。“微调使研究人员能够利用自有数据创建满足其独特研究需求的模型，”阿齐兹说。

深度思维推出了由Gemini 2.0 Pro驱动的协调系统Agentic-Tx，以扩大模型的应用范围。这个代理框架将TxGemma与18种工具整合为一体，包括搜索工具、基因和蛋白质参考以及分子分析模块，以处理生物学和化学中的多步推理任务。Agentic-Tx在ChemBench和Humanity’s Last Exam等高难度基准测试中表现优异。

另一份Colab笔记本演示了该系统如何管理复杂的治疗工作流。“我们期待看到社区如何借助TxGemma加速治疗性发现，”阿齐兹说。

(以上内容均由Ai生成)