“AI读脑技术新突破:将思维转化为文字”
快速阅读: 研究人员开发出“思维字幕”技术,能根据大脑活动生成描述所见或想象画面的句子,准确度高。此技术有助于语言障碍者交流,相关研究发表于《科学进展》。
利用脑电波读取人的思维听起来像是科幻情节,但现在这一目标又向前迈进了一步。一种名为“思维字幕”的新技术能够根据大脑活动记录生成描述人所见或想象画面的句子,且准确度令人印象深刻。
该技术在今日发表于《科学进展》的一篇论文中被详细描述,不仅揭示了大脑如何在形成言语之前表示世界,还可能帮助语言障碍者(例如中风患者)更好地交流。
加州大学伯克利分校的计算神经科学家亚历克斯·休斯表示:“这个模型能预测出人们看到的东西‘非常详细’。这是一件很难做到的事,能获得如此多的细节令人惊讶。”
扫描与预测
研究人员已经能够通过大脑活动准确预测一个人看到或听到的内容超过十年了。然而,解读大脑对复杂内容(如短片或抽象图形)的理解一直是个难题。
日本神奈川NTT通信科学实验室的计算神经科学家堀川智康指出,之前的尝试只能识别出描述人所见的关键词汇,而非完整的上下文,后者可能包括视频的主题及其发生的动作。其他方法则使用了能够自动生成句子结构的人工智能(AI)模型,这使得难以确定描述是否确实反映在大脑中。
堀川的方法首先使用深度语言AI模型分析了2000多个视频的文字说明,将每个说明转化为独特的数字“意义签名”。然后,另一个AI工具通过对六名参与者观看视频时的大脑扫描进行训练,学会了将每种意义签名与相应的大脑活动模式相匹配。
一旦训练完成,这个大脑解码器就能读取一名观看视频者的全新脑电图,并预测其意义签名。随后,不同的AI文本生成器会寻找最接近从个人大脑解码出的意义签名的句子。
(以上内容均由Ai生成)