语音合成 – 数智风暴

快速阅读: 12月8日消息，阿里巴巴推出通义千问Qwen3-TTS语音合成模型，支持49种音色、10种语言及9种方言，免费开放每月百万字符额度，并在上海120所中小学试点教育应用。今日，阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

快速阅读: 韩国报告显示，朝鲜AI技术已达军事和网络行动应用水平，涵盖人脸识别、语音合成等，基于2025年公开论文分析，显示多目标跟踪、口音识别等领域显著进步。据韩国一份新报告显示，朝鲜已将其人工智能技术发展到可用于军事和网络行动的程度， […]

快速阅读: 火山引擎在FORCE LINK AI巡展武汉站推出四款豆包大模型新品，涵盖1.6升级版、1.6lite及语音合成与声音复刻模型2.0，提升智能化与灵活性，降低企业使用成本。在今天的 FORCE LINK AI 创新巡展武汉站活 […]

快速阅读: 面壁智能与清华大学合作发布VoxCPM，0.5B参数规模，实现高质量语音合成。该模型在自然度、音色相似度等方面领先，支持零样本声音克隆，已开源并提供线上体验。在语音合成技术迅速发展的背景下，面壁智能与清华大学深圳国际研究生院人 […]

快速阅读: 微软发布最新语音转语音模型GPT-realtime，集成自然语言处理、优质音频及精准指令执行等优势，推出Marin和Cedar两种语音选项，支持多模态交互，价格下调20%。微软正式宣布,其最新的语音转语音 (S2S) 模型 […]

快速阅读: 微软研究院开源VibeVoice-1.5B音频模型，实现90分钟超长语音合成，支持四位发言人，3200倍音频压缩，采用双tokenizer架构，提高合成质量和效率。近日，微软研究院正式开源最新音频模型——VibeVoice-1 […]