AI

Stability AI发布Stable Audio2.5,音频生成技术再突破

发布时间:2025年9月11日    来源:szf
Stability AI发布Stable Audio2.5,音频生成技术再突破

快速阅读: Stability AI 发布 Stable Audio2.5,支持复杂音乐创作,响应情感和风格提示,生成速度快,兼容移动设备,具备音频修补功能,确保版权合规,适用于多领域,与 WPP 合作。

近日,Stability AI 推出了最新音频生成模型 Stable Audio2.5,旨在为专业音效制作提供更高效的解决方案。该模型设计的初衷是帮助创意团队快速生成高质量、可定制的音频作品,以满足市场对音频内容日益增长的需求。

Stable Audio2.5 的最大亮点在于其生成能力更为复杂,能够创作包括引子、发展和尾声在内的多段音乐作品。Stability AI 表示,新模型能够更准确地响应情感提示,如“振奋人心”,并能理解特定音乐风格的提示,例如“丰富的合成器声”。用户只需几秒钟即可生成最长三分钟的音乐曲目,而在 Nvidia H100 GPU 上,处理时间甚至低于两秒。

该模型的速度得益于其采用的后期训练方法——对抗相对对比(Adversarial Relativistic-Contrastive,简称 ARC),这一技术由公司研究团队开发。Stability AI 于今年五月还推出了一款适用于智能手机的紧凑版本,同样使用 ARC 方法。Stable Audio Open Small 模型能够在移动设备上生成最多11秒的立体声音频,仅需七秒钟。

在功能方面,Stable Audio2.5 的主要更新是音频修补功能。用户可以上传自己的音频文件,选择起点,让 AI 生成后续内容,完成或扩展现有的录音。此外,用户还可以通过文字提示生成音乐。需要注意的是,上传的文件必须是无版权的,Stability AI 通过先进的识别系统来确保版权合规。与早期版本一样,Stable Audio2.5 也是在一个已授权的数据集上进行训练的,被认为商业安全。

Stability AI 希望该技术能应用于广告、零售、品牌音效等多个领域,与 WPP 旗下的音效品牌代理机构 Amp 合作,为大型客户提供一致的音频识别服务。Stability AI 的音频团队还可以根据公司的音效库调整模型,打造独特的音频标识。Stable Audio2.5 将通过 WPP Open 平台面向 WPP 的全球客户开放。

自2024年4月推出 Stable Audio2 以来,Stability AI 已开始在音频领域扩展合作伙伴网络,努力增强自身的财务实力。今年3月,WPP 集团对 Stability AI 进行了不公开的投资,而 Meta 也在加速推进其音频研究。

(以上内容均由Ai生成)

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日