阶跃星辰发布30亿参数音频编辑模型,语音编辑如改Word

发布时间:2025年11月10日    来源:szf
阶跃星辰发布30亿参数音频编辑模型,语音编辑如改Word

快速阅读: 国内AI独角兽阶跃星辰发布Step-Audio-EditX模型,实现自然语言指令编辑语音,支持普通话、英语、四川话和粤语,自然度评分4.72/5,情感准确率93.7%,音色保持度98.1%,引领音频内容生产新变革。

国内AI独角兽阶跃星辰(StepStepFun AI)于11月9日发布了全球领先的LLM级音频编辑模型——Step-Audio-EditX,首次实现了“通过自然语言指令编辑语音”的革命性体验。用户只需输入“将这段话改为川渝rapper的嚣张语气”或“在结尾加上一个害羞的笑声”,模型就能精确调整音色、情绪、节奏乃至呼吸停顿,使得语音编辑如同修改文档一般直观、高效。

Step-Audio-EditX的核心突破在于其高效的模型压缩技术。研发团队将原本130亿参数的模型精简至30亿,不仅显著降低了部署成本,还在关键性能指标上实现了超越。该模型支持零样本语音克隆,仅需一段参考音频,无需目标人物的任何训练数据,就能高保真地再现其音色;同时支持多轮迭代编辑,用户可以连续发出细化指令(如“再温柔一些”“将笑声延长0.3秒”),逐步达到理想的编辑效果。

该模型对中文语境的理解尤其出色,能够流畅支持普通话、英语、四川话和粤语,方言表达中的地域情感与语用习惯自然真实。在盲测中,评估人员一致认为其“川渝段子的市井感”和“粤语语气词的细腻度”远超同类产品。

与Minimax及字节跳动Doubao等闭源方案相比,Step-Audio-EditX在自然度评分、情感准确率和音色保持度三项核心指标上全面领先。据AIbase获取的对比数据显示,Step-Audio-EditX的自然度评分为4.72/5,情感准确率达到93.7%,音色保持度高达98.1%。

这项技术正在催生全新的内容形态:短视频博主可以一键切换“元气少女”、“毒舌导师”等人设声音;有声书创作者能独立完成多角色的情感对白;四川话搞笑视频经过AI重制,瞬间变成美式脱口秀风格,成功走向国际市场;听障用户的语音合成系统首次具备了“情感温度”,不再显得冰冷机械。

AIbase认为,Step-Audio-EditX的意义远不止于工具的升级——它正在重塑音频内容的生产逻辑。当语音不再是一旦录制便不可更改的线性媒介,而是可以反复打磨的“活文本”时,数以万计的创作者将获得前所未有的表达自由。未来,如果阶跃星辰开放API或将其集成到手机系统中,这把“AI魔法剪刀手”或将真正走进每个人的口袋,让每一次发声都能被重新定义。

(以上内容均由Ai生成)

你可能还想读

阿塞拜疆加速AI发展,打造数字政府与智能经济

阿塞拜疆加速AI发展,打造数字政府与智能经济

快速阅读: 阿塞拜疆加大AI在各领域应用,发布《2025-2028年人工智能战略》,与中方合作密切,共同推进数字经济发展,提高公共服务效率,促进经济增长。 人类正处于第四次工业革命和工业4.0发展的门槛上,这建立在将人工智能(AI)融入所有 […]

发布时间:2025年11月10日
亚股上涨,科技股从AI担忧中反弹

亚股上涨,科技股从AI担忧中反弹

快速阅读: 亚太股市周一普遍上涨,科技股反弹显著。韩国综指领涨3.5%,SK海力士因与英伟达合作股价飙升5.5%。东京日经225指数上涨1.2%,香港恒生指数涨0.8%。 亚太股市周一上涨,科技股反弹,摆脱了上周因人工智能相关股票上涨带来的 […]

发布时间:2025年11月10日
科技巨头重金押注韩国AI未来,打造亚太智能供应链中心

科技巨头重金押注韩国AI未来,打造亚太智能供应链中心

快速阅读: 近几个月,韩国成美科技巨头投资热点,英伟达、OpenAI和亚马逊投资数十亿美元,加强AI基础设施。韩国具半导体、制造及政府支持优势,成AI竞赛宝贵资源。 韩国凭借其半导体实力和制造基地,在物理人工智能竞赛中占据中心位置。从左至右 […]

发布时间:2025年11月10日
印度IT业下半年因AI项目和客户参与度提升而复苏

印度IT业下半年因AI项目和客户参与度提升而复苏

快速阅读: 印度IT行业预计FY26下半年表现改善,得益于AI项目、客户互动提升及自由支配支出增长,银行业、金融服务和保险业将引领复苏,零售和汽车行业因外部因素承压。 印度孟买(马哈拉施特拉邦),11月10日(ANI):据Centrum研究 […]

发布时间:2025年11月10日
欧盟拟放宽AI数据使用规则,隐私保护面临挑战

欧盟拟放宽AI数据使用规则,隐私保护面临挑战

快速阅读: 欧盟委员会拟修改《通用数据保护条例》,允许AI公司合法处理敏感数据,重新定义个人数据范畴,并改革Cookie横幅规则。提案需经欧盟国家和立法者审议,引发隐私与金融利益之争。 拟议的修改将为人工智能公司创建新的例外,允许它们合法地 […]

发布时间:2025年11月10日
开源Presentation-AI免费上线,本地运行碾压Gamma.app

开源Presentation-AI免费上线,本地运行碾压Gamma.app

快速阅读: 近日,开源社区推出Presentation-AI,仅需简单提示即可生成精美演示文稿,完全免费且支持本地部署,强调人机协同创作,提供高度可控性和专业输出,评分4.8/5,极大提升效率。 告别熬夜改PPT的时代来了。近日,开源社区爆 […]

发布时间:2025年11月10日
为上市铺路?稚晖君创业的智元机器人完成股改

为上市铺路?稚晖君创业的智元机器人完成股改

快速阅读: 智元机器人关联公司更名为智元创新(上海)科技股份有限公司,计划明年三季度在香港IPO,目标估值400亿至500亿港元。 IT之家 11 月 10 日消息,智元机器人关联公司智元创新(上海)科技有限公司 11 月 6 日发生工商变 […]

发布时间:2025年11月10日
月之暗面开源Kimi K2Thinking,460万美元训练成本登顶HLE

月之暗面开源Kimi K2Thinking,460万美元训练成本登顶HLE

快速阅读: Moonshot AI 开源最强思考型大模型 Kimi K2Thinking,以 44.9% 成绩领先国际,训练成本仅 460 万美元,远低于行业平均水平,性能卓越且全面开源,降低 AI 应用门槛。 国产大模型再出重磅。本周四, […]

发布时间:2025年11月10日