ElevenLabs 将莫迪总理的声音推向世界

发布时间:2025年3月18日    来源:szf
ElevenLabs 将莫迪总理的声音推向世界

快速阅读: 《印度分析杂志》消息,近期,计算机科学家莱克斯·弗里德曼与印度总理莫迪的三小时播客因高质量AI翻译获关注。ElevenLabs,一家成立仅三年的公司,支持29种语言的AI模型,助力全球信息传播。该公司在印度扩展团队,专注于多语言技术支持及创作者服务,同时探索AI伦理与多模态交互未来。

近日,一场由计算机科学家莱克斯·弗里德曼(Lex Fridman)与印度总理纳伦德拉·莫迪(Narendra Modi)共同参与的长达三小时的播客引发了广泛关注。这场播客以印地语、英语甚至俄语等多种语言流播,被许多人誉为迄今为止最佳的配音作品。这种近乎超现实的人工智能翻译技术几乎与原声无异,这得益于一家成立仅三年的人工智能初创公司——ElevenLabs的技术支持。这项技术还被用于将莱克斯在基辅对乌克兰总统弗拉基米尔·泽连斯基(Volodymyr Zelenskyy)的采访翻译成英语、乌克兰语和俄语。

尽管这不是莫迪总理首次利用人工智能进行翻译,但这次合作对ElevenLabs而言意义非凡,因为它帮助世界领导人用多种语言向全球观众传递信息。负责印度ElevenLabs业务的希达拉特·斯里尼瓦桑(Siddharth Srinivasan)在接受AIM采访时提到,印度是ElevenLabs迄今为止最大的市场,公司正在积极扩大其在该国的团队,以构建语音人工智能的未来。他认为,对于一个语言多样性丰富且对可访问性需求极高的国家而言,这无疑是一个巨大的机遇。斯里尼瓦桑透露,ElevenLabs目前在印度已接近拥有10名员工,主要集中在商业相关职位,并计划进一步扩展。这一趋势与西方实验室和初创企业在印度拓展业务的步伐一致。据报道,OpenAI和Perplexity也准备不久后在印度展开布局。上个月,总部位于波兰的初创公司完成了一轮新的融资,估值达到33亿美元,融资金额为1.08亿美元。

ElevenLabs从2022年4月的一个周末项目起步,当时创始人马蒂·斯坦尼斯瓦夫斯基(Mati Staniszewski)和皮奥特·达布科夫斯基(Piotr Dabkowski)着手解决配音质量差的问题,利用逼真的语音合成技术开辟新天地。语音用户界面的重要性尽管语音人工智能领域的竞争异常激烈,包括诸多传统科技公司,但ElevenLabs在印度市场的差异化优势在于能够精准应对不同的口音和语言。ElevenLabs为其人工智能音频技术提供了多个独特的模型,专门针对不同的应用场景,如文本转语音(TTS)和语音转文本(STT)。斯里尼瓦桑补充道:“我们在印地语等印度语言中拥有世界上最快的语音转文字模型。”截至目前,该公司支持11种印度语言,并计划进一步扩展。然而,斯里尼瓦桑指出,“如果双方各有八到十一种语言,[你就覆盖了]印度的70%。”许多印度语言的数字化数据不足仍然是一个明显的挑战。ElevenLabs通过战略伙伴关系和社区参与构建数据集来应对这一问题。

总体而言,该公司的多语言人工智能模型支持29种语言,在每种语言中提供高度真实的、富有情感的声音。此外,他们的对话式人工智能模型支持32种语言,使自然、实时的对话成为可能。他们还在99种语言中开发了一种先进的语音转文本模型,其中包括11种印度语言。印度创作者经济的增长ElevenLabs有效地将其技术产品化,以迎合内容创作者和开发者的需求。其API用户友好,支持大规模集成,特别吸引寻求可扩展解决方案的开发者和企业。播客创作者通常是该公司的主要目标受众。除弗里德曼外,印度科技播主瓦鲁恩·梅亚也利用ElevenLabs的技术为自己的品牌及其他公司服务。该公司还与神经科学家兼播客安德鲁·休伯曼(Andrew Huberman)合作,为他的《Huberman实验室》播客将内容配音成印地语和西班牙语。他们与Spotify的合作有助于生产由人工智能叙述的有声书。斯里尼瓦桑提到,星空体育使用其技术将史蒂夫·史密斯的声音配音成印地语和泰米尔语,并将板球内容本地化以吸引更多观众。

在新功能和合作伙伴方面,去年ElevenLabs推出了GenFM(类似于Google的NotebookLM)用于多说话人播客,并与Pocket FM合作帮助作家将故事转化为音频。除了内容创作市场,印度的重点行业还包括客户服务和教育。最近,该公司还在班加罗尔举办了一场黑客马拉松作为其全球巡展的一部分,印度的注册人数最高。展示的项目包括一个用于情感支持的人工智能助手,一个具有指定角色的内容创建人工智能视频框架,以及一个用于改善农村地区语音人工智能解决方案的无障碍性,尤其是在聊天机器人有限的地区。

人工智能的未来不是单极化的拥有YouTube十年经验的斯里尼瓦桑了解该国的创作者生态系统。他认为人工智能的未来不会局限于单一界面——尽管语音将是其中的一大支柱。他指出了媒体和技术向多模态交互发展的持续趋势,即便在未来,人们也将通过语音、文本、视频和视觉与人工智能互动。“即使在生成式人工智能兴起之前,人们就已经在使用Alexa、Google Assistant和Siri等技术,”他说。但他相信,语音将继续是最自然的界面,因为它依然是最基础且广泛使用的交流形式,深深嵌入到消费者和商业互动中。斯里尼瓦桑还承认了深度伪造的风险,并强调ElevenLabs通过监管、同意授权和可追溯性来防止滥用。

(以上内容均由Ai生成)

你可能还想读

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

快速阅读: 国星宇航与北京邮电大学共建语义卫星联合实验室,聚焦语义卫星星座建设等关键技术,加速太空AI技术转化与应用落地,推动6G通信发展。 IT之家 10 月 22 日消息, 国星宇航今日宣布,将携手北京邮电大学共建语义卫星联合实验室 。 […]

发布时间:2025年10月23日
贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

快速阅读: 贝索斯提出在太空中建立数据中心的构想,利用不间断太阳能解决能源问题,但面临高昂的发射和维护成本及技术挑战。 贝索斯设想在地球大气层外利用持续阳光建立轨道数据中心。该计划承诺提供无限能源,不受云层和天气干扰的影响。然而,发射和维护 […]

发布时间:2025年10月11日
克瑞托斯庆祝Oriole火箭25年辉煌成就

克瑞托斯庆祝Oriole火箭25年辉煌成就

快速阅读: Kratos开发的Oriole火箭因2012年推出的TVC系统而性能大幅提升,完成多次高精度任务,支持全球多地点发射,助力高超音速研究,至今累计140次成功发射,确立行业领先地位。 Oriole的成功之旅因Kratos在2012 […]

发布时间:2025年10月11日
国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

快速阅读: 北京邮电大学研发的“卫星互联网防火墙”安全载荷成功发射,实现物理层与网络层协同防护,具备10Gbps高并发流量检测能力,为卫星互联网安全提供重要保障。 感谢IT之家网友 tellMe 的线索投递! IT之家 9 月 19 日消息 […]

发布时间:2025年9月19日
ICEYE推出战术级太空情报系统ISR Cell

ICEYE推出战术级太空情报系统ISR Cell

快速阅读: ICEYE推出ISR Cell集装箱系统,使国防组织能现场获取近乎实时的太空ISR数据,加速高风险环境决策。系统已验证,提供更快、更可靠的情报,覆盖各决策层。预计2026年初交付,扩展军事客户基础。 美国加利福尼亚州洛杉矶(SP […]

发布时间:2025年9月13日
深学环形塑形技术助力天文观测,深化宇宙理解

深学环形塑形技术助力天文观测,深化宇宙理解

快速阅读: 科研团队开发的深度环路整形技术,显著提升了LIGO引力波观测站的控制精度和稳定性,降低了噪声水平,有助于天文学家更准确地研究宇宙动力学和形成过程,开启了下一代引力波科学的大门。 我们新开发的深度环路整形技术改进了引力波观测站的控 […]

发布时间:2025年9月5日
月球探索新突破!AI 助力撞击坑研究,效率提升惊人

月球探索新突破!AI 助力撞击坑研究,效率提升惊人

快速阅读: 中国科学院地球化学研究所发布“月球科学多模态专业大模型V2.0”,大幅提升月球地质研究效率,未来将向全球开放“数字月球”云平台。 在全球科技迅速发展的今天,中国科学家正借助人工智能的力量,推动月球科学研究的新进展。近日,在202 […]

发布时间:2025年9月1日
我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

快速阅读: 中国将与阿联酋、约旦、埃及等国合作,共建气象卫星数据应用中心,研发灾害早期预警系统,开发气象人工智能模型,提升阿拉伯地区灾害性天气预报能力。 IT之家 8 月 29 日消息,据央视报道,我国将与阿联酋、约旦以及埃及等国家共同开展 […]

发布时间:2025年8月29日