标签: 语音合成
-
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型
快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]
发布时间:2025-12-08 18:14 来源:szf -
朝鲜研发军用AI技术,包括人脸识别和语音合成
快速阅读: 韩国报告显示,朝鲜AI技术已达军事和网络行动应用水平,涵盖人脸识别、语音合成等,基于2025年公开论文分析,显示多目标跟踪、口音识别等领域显著进步。 据韩国一份新报告显示,朝鲜已将其人工智能技术发展到可用于军事和网络行动的程度, […]
发布时间:2025-11-26 19:51 来源:szf -
火山引擎发布四款强大大模型,语音合成与复刻功能再升级
快速阅读: 火山引擎在FORCE LINK AI巡展武汉站推出四款豆包大模型新品,涵盖1.6升级版、1.6lite及语音合成与声音复刻模型2.0,提升智能化与灵活性,降低企业使用成本。 在今天的 FORCE LINK AI 创新巡展武汉站活 […]
发布时间:2025-10-16 16:42 来源:szf -
面壁智能与清华联合发布VoxCPM,革新语音合成体验
快速阅读: 面壁智能与清华大学合作发布VoxCPM,0.5B参数规模,实现高质量语音合成。该模型在自然度、音色相似度等方面领先,支持零样本声音克隆,已开源并提供线上体验。 在语音合成技术迅速发展的背景下,面壁智能与清华大学深圳国际研究生院人 […]
发布时间:2025-09-19 11:55 来源:szf -
微软发布GPT-realtime,提升语音合成与多模态输入
快速阅读: 微软发布最新语音转语音模型GPT-realtime,集成自然语言处理、优质音频及精准指令执行等优势,推出Marin和Cedar两种语音选项,支持多模态交互,价格下调20%。 微软正式宣布,其 最新 的语音转语音 (S2S) 模型 […]
发布时间:2025-09-05 10:44 来源:szf -
微软开源VibeVoice-1.5B模型,实现90分钟超长语音合成
快速阅读: 微软研究院开源VibeVoice-1.5B音频模型,实现90分钟超长语音合成,支持四位发言人,3200倍音频压缩,采用双tokenizer架构,提高合成质量和效率。 近日,微软研究院正式开源最新音频模型——VibeVoice-1 […]
发布时间:2025-08-26 10:52 来源:szf