Google 的 NotebookLM 现在支持 50+ 种语言,支持全球内容
快速阅读: 据《福布斯》称,谷歌扩展NotebookLM AI模型应用,新增多语言音频概览功能,支持超50种语言,提升教育、职业和个人知识管理领域价值。此功能自动以用户首选语言生成,也可手动切换,便于跨语言信息共享。尽管仍有局限,但迭代更新可期。这标志着AI生成媒体的进步,改变多语言内容学习与互动方式。
谷歌通过为其NotebookLM人工智能模型增加多语言音频概览功能,拓展了其应用场景。近期,谷歌刚刚将NotebookLM的多语言音频概览功能扩展至支持超过50种语言,涵盖从南非荷兰语到祖鲁语等多种语言,从而让其AI驱动的内容摘要能够触及更广泛的全球受众。这一多语言更新显著提升了该工具在教育、职业及个人知识管理领域的实用价值。
**多语言音频概览:从病毒式功能到全球工具**
六个月前,我首次撰写关于NotebookLM的多语言音频概览功能的文章,该功能能将文本资料转化为由AI声音呈现的引人入胜的播客风格对话。当时,我曾戏谑地提出,其创造自然对话的能力可能会替代人类播客制作人。值得欣慰的是,尽管确实有一些利用NotebookLM和类似Jellypod工具制作的AI播客出现,但人类播客制作者并未受到太大影响。不过,NotebookLM(尤其是其多语言音频概览)有着诸多实际应用场景。许多用户创建“私人播客”来获取文章或书籍的核心要点,甚至将其作为学习新知识的辅助指南。然而,直到现在,这些便利仅限于英语使用者。如今,借助Gemini的新原生音频功能,这些对话能够在数十种语言中生成。这一扩展是在谷歌去年将NotebookLM推广至200多个国家后实现的,显然,该公司已经意识到这款独特AI模型的巨大潜力。
NotebookLM的RAG锁定模型(仅使用用户上传的信息)相较于通用AI聊天机器人产生的幻觉更少,而来自脚注的帮助则进一步减少了错误,脚注允许用户准确查看所提供的来源内容出处。
**教育领域的全新可能性**
对于教育工作者而言,这种多语言能力带来了令人兴奋的新机遇。准备亚马逊雨林课程的教师可以上传多语言内容——例如葡萄牙语纪录片的字幕、西班牙语研究论文以及英语学习材料,并能在任何支持的语言中生成连贯的音频概览。NotebookLM不仅限于翻译内容,它还能在语言障碍间综合信息,以对话的形式呈现。这种音频内容比传统的文本摘要或标准机器翻译更具吸引力。
**个性化语言偏好**
谷歌以用户友好的方式实现了这一功能。多语言音频概览会自动以用户账户首选语言生成,但在设置中新增的“输出语言”选项允许用户随时更改语言。这种灵活性使得用户可以根据需求创建多语言内容或学习材料。对于在全球范围内运营的企业而言,这项功能可以简化跨不同语言团队的信息共享。研究报告、市场分析报告或竞争评估可以以原始语言上传,然后以听众偏好的语言总结为音频对话。NotebookLM简化了多语言内容的使用流程,用户无需再在上传前单独翻译文档或将就于机器翻译的文本,这一切都在后台完成。这种减少的工作量让服务变得更加有价值,可能推动更高的采用率。
**NotebookLM尚待完善之处**
虽然此次更新大幅增强了NotebookLM的实用性,但该工具仍有诸多不足。用户目前无法控制演讲者的数量、人口统计特征、口音或对话长度,输出仍然是单一音频文件,而非可轻松用于视频创作的独立音轨。鉴于谷歌对NotebookLM的关注,若该工具获得更多关注,这些改进似乎很可能随后推出。公司似乎正在采取迭代方式,根据用户反馈逐步添加功能。
**为笔记本添加AI图标**
尽管不如新增的多语言功能重要,但谷歌也通过为每个笔记本添加图标让NotebookLM更加用户友好。“智能”图标——关于排球教练的笔记本,不出所料,是一个排球;关于神经营销研究的笔记本则是一颗大脑。虽然这不是突破性的进展,但随着用户创建越来越多的笔记本,谷歌未来可能需要添加更多的组织工具。这是个良好的开端。
**迈向AI生成媒体的下一步**
这次更新也标志着向越来越难以与人类创作内容区分开来的AI生成媒体迈进了一步。多语言音频概览的对话性质创造了极为自然的体验。对于内容创作者而言,这项技术既带来机遇也引发问题。这项技术是否最终能生成与人类主持人一样好甚至更好的播客节目或广播节目?谷歌将NotebookLM扩展至50多种语言,展示了AI驱动内容工具的快速发展。通过让通过引人入胜的音频对话轻松访问多语言内容,谷歌可能改变了我们跨越语言障碍学习和互动信息的方式。
(以上内容均由Ai生成)