AI

腾讯ARC发布AudioStory,大语言模型生成长音频

发布时间:2025年9月1日    来源:szf
腾讯ARC发布AudioStory,大语言模型生成长音频

快速阅读: 腾讯ARC团队发布AudioStory模型,结合大语言模型和音频生成技术,生成连贯的长篇叙事音频,提升用户体验,已发布推理代码及应用案例。

近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。

AudioStory 的核心在于其统一的理解与生成框架。该模型能够处理视频配音、音频延续和长篇叙事音频合成等多种任务。通过将大语言模型与音频生成系统结合,AudioStory 能够生成结构化且具有时间一致性的音频叙事。该模型具有强大的指令跟随推理生成能力,可以将复杂的叙事查询分解为按时间顺序排列的子任务,同时保持场景转换的连贯性和情感基调的一致性。

AudioStory 的两个显著特点包括:首先,去耦合的桥接机制,能够有效地将大语言模型与音频生成器之间的协作分成两个专业化的部分;其次,端到端的训练方式,统一指令理解与音频生成,提升了组件之间的协同效应。

此外,研究团队还建立了一个名为 AudioStory-10K 的基准数据集,涵盖动画音景和自然声音叙事等多样化领域。通过大量实验,AudioStory 在单音频生成和叙事音频生成方面的表现优于以往的文本到音频生成模型,展现出卓越的指令跟随能力和音频质量。

目前,团队已经发布了模型的推理代码,并展示了一系列演示视频,包括经典动画《猫和老鼠》的配音示例,以及基于文本生成长音频的应用案例,展示了该模型的广泛适用性和强大功能。

项目:https://github.com/TencentARC/AudioStory 划重点: 🎧 **AudioStory 是腾讯 ARC 推出的长篇叙事音频生成模型,结合了大语言模型和音频生成技术。** 📊 ** 模型具有强大的指令跟随能力,能够生成连贯的音频叙事,提升用户体验。** 🛠️ ** 团队已发布推理代码,并展示多个应用案例,展现其在视频配音和长音频生成上的优势。**

(以上内容均由Ai生成)

你可能还想读

亚马逊推Alexa+迈入全代理AI时代

亚马逊推Alexa+迈入全代理AI时代

快速阅读: 据外媒报道,亚马逊推出新一代智能体AI系统Alexa+,中兴与字节跳动联合研发全球首款全智能体AI手机,该技术正加速渗透医疗健康领域,可自主执行复杂任务并提升服务效率。 近日,全球人工智能领域加速向“智能体”(agentic A […]

发布时间:2025年12月8日
网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日