法国初创公司 Gladia 推出下一代多语言语音转文本 AI 模型 Solaria
快速阅读: 据《硅角度》最新报道,人工智能公司格拉迪亚发布实时多语言AI模型Solaria,提升语音识别准确性和响应速度,支持100种语言,助力企业跨越语言障碍,优化客户体验。
总部位于巴黎的人工智能公司格拉迪亚,作为AI转录和音频智能服务的开发者,今日正式发布了Solaria,一款专为实时多语言通信设计的尖端AI模型。尽管许多企业通过外包呼叫中心及其他业务用途的转录和翻译来降低成本,但构建实时支持系统以应对全球客户群体的需求变得愈发紧迫。根据语言行业分析师Slator在2023年的市场报告显示,全球范围内接受调查的高管中有49%表示因语言障碍导致经济损失。格拉迪亚表示,与市场上的竞争对手相比,Solaria在超快速度下提供了行业领先的语音识别准确性。公司基准测试显示,该AI的平均词准确率达到了94%,这是行业内最高的,适用于英语、西班牙语、法语等常见语言。当用户开始说话时,其首次响应时间约为270毫秒,使其成为行业内响应速度最快的语音到文本模型之一。这大约是与苹果公司的Siri或“嘿,谷歌”对话时所需的时间,并且用户需要等待多久才能看到屏幕上的第一个字出现。这也展示了AI在句子中断时的快速反应能力,允许它迅速调整并作出反应。延迟越短,它与用户的对话就越流畅。Deepgram公司的平台是目前延迟最低的竞争者,为223毫秒。AI仅用698毫秒即可完成完整转录,比大多数竞争对手快将近半秒。Deepgram平均需要1040毫秒,而Speechmatics则需要1158毫秒。
“语音是最自然的连接世界的方式——首次,自动语音识别正在缩小差距,使人类和AI能够真正使用同一种语言交流,”格拉迪亚联合创始人兼首席执行官让-路易·凯吉纳说道。
格拉迪亚表示,Solaria可以处理100种语言,其中包括42种未被竞争对手支持的小众语言。该公司团队包括对高人口市场和呼叫中心外包枢纽中常见的区域语言(如他加禄语、孟加拉语、旁遮普语、泰米尔语、乌尔都语、波斯语和马拉地语)达到母语水平的准确性。它还覆盖了新兴的语音市场,如海地克里奥尔语、毛利语、爪哇语和马达加斯加语。该公司构建了AI以适应并学习特定行业的专业术语,以便它可以融入关键业务操作并理解员工的语音模式,包括医学或金融术语。AI还能在嘈杂或喧闹的环境中处理语音,例如拥挤的呼叫中心,确保高精度。
“借助Solaria,我们在AI驱动的语音技术上取得了突破,为企业解锁了新的机会,提高了效率,并在不同语言和市场中提供了更无缝、更有影响力的客户体验,”凯吉纳补充道。
作为发布的一部分,格拉迪亚宣布与开源开发框架LiveKit建立战略合作伙伴关系。这将使开发人员能够使用格拉迪亚的应用程序编程接口来构建具有内置多语言翻译功能的语音对话代理,用于AI驱动的应用程序。
自2023年推出其首个转录和音频智能API以来,格拉迪亚在企业市场获得了显著的关注,尤其是在会议记录器和笔记助手方面。该公司平台现在被全球超过700名客户使用,包括Attention Inc.、Circleback Inc.、Method Financial Inc.、Recall AI Inc.、Sana Labs AB和VEED.IO Ltd.
图片:格拉迪亚
来自SiliconANGLE联合创始人约翰·弗瑞尔的信息:
您的支持对我们非常重要,它帮助我们保持内容免费。只需点击一下即支持我们的使命,提供免费、深入且相关的内容。
加入我们的YouTube社区,其中包含超过15,000位#Cube校友专家的社区,其中包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·格尔辛格等众多名人和专家。
“CUBE是行业的重要合作伙伴。你们确实是我们的活动的一部分,我们非常感谢你们的到来,我知道人们也欣赏你们创造的内容。”——安迪·贾西
(以上内容均由Ai生成)