AI助英国女子重获失声25年声音
快速阅读: 英国艺术家莎拉·埃泽基尔利用8秒老录像和AI技术,恢复了自己因运动神经元病失去的原声,帮助她再次与人交流,让家人听到她真实的声音。
英国艺术家莎拉·埃泽基尔在怀孕期间被诊断出患有运动神经元病,失去说话能力。近日,她借助人工智能技术,利用一段仅有8秒的老家庭录像片段,再次用自己的声音与人交流。
莎拉·埃泽基尔现年59岁,25年前被确诊为运动神经元病时,她正在怀第二个孩子。这种疾病会逐渐损害神经系统,导致舌头、口腔和喉部肌肉无力,使一些患者完全丧失语言能力。确诊后,埃泽基尔曾使用计算机和语音生成技术进行沟通,但声音与她的原声完全不同。她还继续从事艺术创作,通过计算机光标绘制图像。
然而,她的两个孩子阿维娃和埃里克从未听过母亲原本的声音。近年来,专家们开始利用技术创建计算机化的个人原始声音,但通常需要长时间且高质量的录音,即使如此,生成的声音也往往“非常平淡单调”。
英国医疗通信公司Smartbox的技术专家西蒙·普尔表示,他们最初希望获得埃泽基尔一小时的音频资料。由于智能手机普及之前,合适的录音较为罕见,埃泽基尔只能找到一段1990年代的家庭录像片段,只有8秒钟,音质模糊且伴有电视背景音。普尔并未放弃,他使用纽约AI语音专家ElevenLabs开发的技术,不仅基于少量音频生成声音,还能使其听起来更加真实。
普尔先用一种AI工具从录像片段中提取声音样本,再用另一种经过真实声音训练的工具填补空白,最终生成了接近埃泽基尔原声的效果,包括伦敦口音和她曾经讨厌的轻微口吃。埃泽基尔听后非常高兴,她将样本发给朋友,朋友表示这就像她找回了自己的声音。
英国运动神经元病协会指出,约80%的患者在确诊后会出现语言障碍。当前的计算机生成声音在音调和节奏上可能显得较为机械。普尔认为,这项新技术的进步在于生成的声音更加人性化和富有表现力,恢复了以往计算机化声音所缺乏的人情味。个性化声音有助于保留一个人的身份,尤其是对于那些在晚年患病并失去声音的人来说,能够使用自己的原始声音进行交流非常重要,而不仅仅是使用现成的合成声音。
(以上内容均由Ai生成)