AI解码大脑活动,将思维转化为文字
快速阅读: 研究人员开发出“心灵字幕”技术,能从大脑活动读取并生成描述所见或想象画面的句子,有助于语言障碍患者沟通。该技术通过深度学习模型和脑电图训练实现,已在《科学进展》上发表。
通过记录大脑活动来读取一个人的想法听起来像是未来的科技,但这现在已经向现实迈进了一步。一种被称为“心灵字幕”的新技术能够以惊人的准确度,从大脑活动的读数中生成描述某人所见或想象的画面的句子。
这项技术在今日发表于《科学进展》上的论文中进行了描述,不仅揭示了大脑如何在将思维转化为语言之前表征世界,还可能帮助那些因中风等原因导致语言障碍的人更好地沟通。
加州大学伯克利分校的计算神经科学家亚历克斯·休斯表示:“该模型能预测人们看到的内容‘非常详细’,这很难做到,令人惊讶的是,竟然能获取如此多的细节。”
扫描与预测
研究人员已经能够利用大脑活动准确预测一个人所见或所听的内容超过十年了。然而,解码大脑对复杂内容(如短片或抽象图形)的理解一直更具挑战性。
日本神奈川NTT通信科学实验室的计算神经科学家堀川智康表示,以往的尝试只能识别出描述某人所见的关键词汇,而未能涵盖完整的上下文,比如视频的主题和其中发生的动作。其他尝试则使用了可以自行构建句子结构的人工智能(AI)模型,这使得难以确定描述是否确实反映在大脑中。
堀川的方法首先使用深度语言AI模型分析了2000多个视频的文字说明,将每个说明转化为独特的数值“意义签名”。然后,另一个AI工具通过训练六名参与者的脑电图,学会了识别与每个意义签名相匹配的大脑活动模式,这些参与者在观看视频时提供了脑电图数据。
一旦训练完成,这个大脑解码器就能读取一名观看视频者的新脑电图,并预测其意义签名。随后,不同的AI文本生成器会寻找最接近从个体大脑解码出的意义签名的句子。
(以上内容均由Ai生成)