科大讯飞发布AI软硬一体方案:在90分贝噪声中也能精准识别
快速阅读: 科大讯飞在2025年1024开发者节发布AI软硬一体解决方案,大幅提升高噪声环境下的语音识别精度,同时推出“百变声音复刻”技术,支持个性化语音创作,广泛应用于数字人、有声读物等领域。
在2025年科大讯飞1024开发者节上,科大讯飞正式发布 AI软硬一体解决方案 ,通过AI算法与硬件架构的深度融合,实现了在高噪声、远场等复杂环境下的精准识别与理解。这一突破被视为语音与视觉智能融合领域的重要进展。
讯飞表示,传统AI语音识别系统在嘈杂环境下往往存在准确率下降的问题。为此,科大讯飞在软硬件一体化设计上进行了系统性创新,让AI不仅能“听清”,还能“看懂”。
基于该方案,讯飞多款AI硬件的降噪与识别性能显著提升: 讯飞智能办公本 X5 搭载行业首创“上4下4环”八麦克风阵列,在远场高噪音环境下的识别效果 远超 iPhone17Pro ; 讯飞 AI 翻译耳机 在地铁、展会等复杂场景中识别准确率达到 97.1% ; 讯飞双屏翻译机2.0 在 90dB 工厂轰鸣声 环境下依然实现 98.69% 的语音识别准确率。
讯飞方面称,这些成果得益于其在语音增强、声源定位、回声消除和多模态感知算法上的持续积累。
在本次开发者节上,科大讯飞还发布了基于 星火语音大模型 的“ 百变声音复刻 ”技术。用户只需一句录音即可高保真复刻任意音色,并可通过一条指令生成不同风格的声音输出。
这项技术的出现,意味着个性化语音创作进入普及阶段。它可广泛应用于 数字人、有声读物、影视配音、内容创作 等领域,让每个人都能快速打造属于自己的“AI声音分身”。
(以上内容均由Ai生成)