教法学硕士阅读和写作 DNA 的诗歌迷

发布时间：2025年2月19日来源：szf

快速阅读: 据《每天 3 夸克》称，《量子》杂志中，英格丽德·维克尔格伦提到，人们常将DNA比作书写语言，但人类难以理解这些生命指令。计算机科学家布莱恩·希发明了Evo，一个基于3000亿个碱基对数据训练的基因组大规模语言模型，以帮助解析DNA序列的功能信息。更多详情请查阅原文。

英格丽德·维克尔格伦在《量子》杂志中写道：人们常把DNA比作书写语言。这个比喻很直观：就像字母表中的字母一样，分子（即腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤的核苷酸碱基A、T、C和G）在所有生物体中，从细菌到人类，都按顺序排列成序列——词语、段落、章节等。它们编码信息的方式就像一种语言。但是人类难以轻松地阅读或理解这些生命指令。我们不能一眼看出一个在生物体内起作用的DNA序列与随机排列的A、T、C和G序列之间的区别。“人类很难理解生物序列，”计算机科学家布莱恩·希说道，他是斯坦福大学进化设计实验室的负责人，并且该实验室位于非营利机构弧研究所。“这正是他发明新工具Evo的原因，Evo是一个基因组大规模语言模型（LLM），他将其称为DNA领域的ChatGPT。”ChatGPT是在大量英文文本上进行训练的，通过算法学习模式，使其能够读写原创句子。同样，Evo也是基于大量DNA数据进行训练的，这些数据包括来自270万种细菌、古菌和病毒基因组的3000亿个碱基对，目的是从用户输入的提示中提取功能信息。更多信息请点击这里。您喜欢3QD的内容吗？请通过捐款帮助我们继续下去。

(以上内容均由Ai生成)