AI

微软开源VibeVoice TTS模型,支持90分钟超长语音及4人对话,中文效果出色

发布时间:2025年8月26日    来源:szf
微软开源VibeVoice TTS模型,支持90分钟超长语音及4人对话,中文效果出色

快速阅读: 微软推出开源TTS模型VibeVoice,支持最长90分钟连续语音生成、4人对谈及中文语音合成,助力播客、教育等领域,已于2025年8月26日上线GitHub。

近日,微软推出备受瞩目的开源文本转语音(TTS)模型VibeVoice,引发AI语音技术领域的高度关注。这款模型以强大功能和卓越性能,为长篇语音生成、多人对话及中文语音合成树立了新的标杆。以下详细解析VibeVoice的亮点与潜力。

VibeVoice实现语音生成时长的重大突破,可一次性生成长达90分钟的连续语音。这一特性尤其适合需要长时间音频输出的场景,如播客、有声书和教育内容制作。相比传统TTS模型的时长限制,VibeVoice的超长生成能力为内容创作者提供了更大的灵活性和创作空间。

VibeVoice能流畅生成最多4人的对谈语音,突破了以往TTS模型仅支持单人或双人对话的局限。这一功能在模拟多人播客、会议录音或虚拟角色互动等场景中表现出色。得益于其在语音一致性和自然轮转上的优化,VibeVoice生成的多人对话语音自然流畅,几乎可媲美真人录音效果。

对于中文市场,VibeVoice展现了令人印象深刻的表现。它支持中文语音合成,在语调、发音准确性和自然度上均达到高水平。这使得VibeVoice在中文播客、教育培训、智能客服等领域具有广泛的应用潜力,为开发者提供高质量的本土化语音解决方案。

VibeVoice的另一大亮点是支持生成带背景音乐的播客音频。这一功能让内容创作者能够轻松为语音添加背景音效,打造更具沉浸感和专业性的音频内容。无论是轻松的背景旋律还是紧张的氛围音效,VibeVoice都能无缝融合,为听众带来更丰富的听觉体验。

作为一款开源模型,VibeVoice已于2025年8月26日在GitHub正式发布,开发者可自由获取并进行二次开发。微软此次开源举措不仅降低了高质量TTS技术的使用门槛,也为全球AI开发者社区注入了新的活力。无论是个人创作者还是企业用户,都可以通过VibeVoice快速构建创新的语音应用。

地址:https://huggingface.co/microsoft/VibeVoice-1.5B

(以上内容均由Ai生成)

你可能还想读

英国Lodestar获资推进AI卫星感知系统

英国Lodestar获资推进AI卫星感知系统

快速阅读: 据英国航天局消息,该局通过SECP计划向洛德斯塔空间公司提供3万英镑资助,用于提升其“米斯里尔”在轨感知系统的激光雷达精度,支持2026年飞行演示,强化英国在自主空间操作领域的竞争力。 英国航天局近日通过其“空间生态系统商业化计 […]

发布时间:2025年12月8日
软银收购DigitalBridge加码AI算力布局

软银收购DigitalBridge加码AI算力布局

快速阅读: 据彭博社报道,美国数字桥公司加速布局亚太数字基建,整合通信塔与数据中心资源,以满足AI算力激增带来的低延迟、高带宽需求,强化其全球基础设施地位。 近日,美国数字桥公司(DigitalBridge)在拓展亚洲数字基础设施布局方面动 […]

发布时间:2025年12月8日
贝莱德:AI投资将驱动美国经济韧性增长

贝莱德:AI投资将驱动美国经济韧性增长

快速阅读: 据贝莱德发布消息称,美国经济正迈入由大规模人工智能投资驱动的资本密集型阶段,预计2030年全球AI相关资本支出将达5至8万亿美元,重塑产业格局并影响供应链与劳动力市场。 日前,全球知名资产管理公司贝莱德在其最新发布的全球经济展望 […]

发布时间:2025年12月8日
硅谷预言:AI将重塑工作与收入

硅谷预言:AI将重塑工作与收入

快速阅读: 据最新消息,人工智能加速冲击全球就业结构,部分职业或将消失,肯尼亚试点全民基本收入项目引发隐私争议,国际社会呼吁构建适应AI时代的社会保障政策框架。 近日,人工智能技术加速渗透全球多个行业,引发对就业结构和收入模式的广泛关注。多 […]

发布时间:2025年12月8日
AI重塑广告业:从执行到智能协同

AI重塑广告业:从执行到智能协同

快速阅读: 据最新消息,广告传播机构加速转型为智能协同伙伴,依托AI优化创意系统,融合算法效率与人文共情,构建“智能+共情”双轮驱动战略,提升传播精准度与内容温度。 人工智能正加速从实验室走向实际应用,其价值日益体现在广告、媒体等行业的日常 […]

发布时间:2025年12月8日
AI推动数据分析普及,渠道伙伴机遇扩大

AI推动数据分析普及,渠道伙伴机遇扩大

快速阅读: 据最新消息,Tableau首席产品官指出AI正推动数据分析进入新阶段,聚焦对话式分析、实时洞察与语义层技术三大方向,2025年成AI应用部署关键年。 日前,数据分析企业Tableau首席产品官索南德·琼斯表示,随着人工智能技术加 […]

发布时间:2025年12月8日
欧盟报告:AI训练应借鉴Napster版权教训

欧盟报告:AI训练应借鉴Napster版权教训

快速阅读: 欧洲议会法律事务委员会发布报告,主张通过强制性法定许可制度解决AI训练数据版权争议,允许使用公开作品并支付统一版税,以平衡创新激励与权利人补偿,避免“选择退出”机制导致模型偏见。 日前,欧洲议会法律事务委员会发布题为《版权与人工 […]

发布时间:2025年12月8日
特朗普推AI新政,各州监管加速推进

特朗普推AI新政,各州监管加速推进

快速阅读: 据最新消息,美国科罗拉多、加州和纽约等州加速推进AI监管立法,分别聚焦算法歧视、高风险系统披露及自动化决策监管,但行业担忧各州标准不一或阻碍全国AI产业发展。 近日,美国多个州加快人工智能监管立法步伐,以应对算法偏见、数据隐私及 […]

发布时间:2025年12月8日