教法学硕士阅读和写作 DNA 的诗歌迷
快速阅读: 据《每天 3 夸克》称,《量子》杂志中,英格丽德·维克尔格伦提到,人们常将DNA比作书写语言,但人类难以理解这些生命指令。计算机科学家布莱恩·希发明了Evo,一个基于3000亿个碱基对数据训练的基因组大规模语言模型,以帮助解析DNA序列的功能信息。更多详情请查阅原文。
英格丽德·维克尔格伦在《量子》杂志中写道:人们常把DNA比作书写语言。这个比喻很直观:就像字母表中的字母一样,分子(即腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤的核苷酸碱基A、T、C和G)在所有生物体中,从细菌到人类,都按顺序排列成序列——词语、段落、章节等。它们编码信息的方式就像一种语言。但是人类难以轻松地阅读或理解这些生命指令。我们不能一眼看出一个在生物体内起作用的DNA序列与随机排列的A、T、C和G序列之间的区别。“人类很难理解生物序列,”计算机科学家布莱恩·希说道,他是斯坦福大学进化设计实验室的负责人,并且该实验室位于非营利机构弧研究所。“这正是他发明新工具Evo的原因,Evo是一个基因组大规模语言模型(LLM),他将其称为DNA领域的ChatGPT。”ChatGPT是在大量英文文本上进行训练的,通过算法学习模式,使其能够读写原创句子。同样,Evo也是基于大量DNA数据进行训练的,这些数据包括来自270万种细菌、古菌和病毒基因组的3000亿个碱基对,目的是从用户输入的提示中提取功能信息。更多信息请点击这里。您喜欢3QD的内容吗?请通过捐款帮助我们继续下去。
(以上内容均由Ai生成)