Mistral推出Voxtral 开源AI音频模型新时代来临
快速阅读: 相关媒体消息,法国初创公司Mistral发布开源音频模型Voxtral,支持多语言转录,性能优于Whisper,价格仅为一半。用户可免费下载API。
据AIbase报道,9月12日,法国巴黎,初创企业Mistral正式发布了其首个开源音频模型——Voxtral,旨在打破大型企业封闭系统的垄断,为开发者提供更灵活且经济的替代方案。
Mistral表示,Voxtral是首个在实际应用中提供“真正可用的语音智能”的开源模型,使开发者无需在低成本的开源系统和高效但封闭的解决方案之间做出艰难选择。Voxtral的价格优势明显,仅为市场上同类产品的不到一半。
Voxtral可以转录长达30分钟的音频,基于Mistral的大型语言模型Small3.1,用户能够处理长达40分钟的音频内容。除了基本的转录音频功能外,Voxtral还支持多语言转录,包括英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语和意大利语。
Mistral提供了三种不同版本的Voxtral模型:Voxtral Small拥有240亿个参数,适合生产级部署;Voxtral Mini具有30亿个参数,适用于本地和边缘部署;Voxtral Mini Transcribe则是一个超经济版,参数为3亿,专为转录场景优化,性能优于OpenAI的Whisper,价格却不到其一半。
用户可以通过Hugging Face免费下载Voxtral的API,或在Mistral的聊天机器人Le Chat中进行测试。API的集成费用从每分钟0.001美元起。
此次发布正值Mistral一个月前推出推理模型Magistral之际,该模型通过逐步解决问题来提高可靠性。作为欧洲顶尖的人工智能公司之一,Mistral一直致力于推动开源AI模型的发展。据悉,Mistral正在与投资者洽谈,计划筹集高达10亿美元的资金,其中阿布扎比的MGX基金也在考虑之列。
(以上内容均由AI生成)