AI首次达到人类专家语言分析水平
快速阅读: 公开资料显示,研究人员通过30种全新人工语言测试大语言模型o1的音系规则推断能力,发现其能精准识别复杂语音模式,表现远超预期,但尚无法提出原创语言理论,引发学界对模型能力边界与人类语言独特性的深入探讨。
研究人员近期开展了一项音系学实验,旨在探究大语言模型能否在无先验知识的情况下推断人工语言的音系规则。音系学研究语音模式及音位(即最小语音单位)的组织方式。人类在习得母语时,通常通过实践内化这些规则,而无需显性教学。例如,英语中“dogs”一词末尾的“s”发“z”音,而“cats”中的“s”则保持清音,体现了音系规则的系统性。
为测试模型能力,研究团队构建了30种全新微型语言,每种包含40个虚构词汇。这些语言均由研究人员设计,确保大语言模型在训练阶段未曾接触。实验要求模型分析每种语言的音系过程。其中,模型o1成功识别出某语言中的一条规则:“当元音前接一个浊音且为阻塞音(如‘top’中的‘t’)的辅音时,该元音会变为气声元音。”
由于所用语言均为首次创造,o1的表现排除了记忆或复现训练数据的可能性。研究者莫滕森表示:“结果之强、之精准,远超预期。”
当前成果表明,大语言模型原则上具备执行复杂语言学分析的能力。然而,尚无模型能提出原创性语言理论,亦未揭示人类此前未知的语言规律。这引发学界进一步思考:语言模型的能力边界何在?其进步是否仅依赖算力、规模与数据的持续扩展,抑或人类语言的某些特质源于物种特有的演化机制,难以被机器复现?
(以上内容均由Ai生成)