AI

阿里通义升级Fun-ASR,垂直领域识别率提升15%以上

发布时间:2025年8月24日    来源:szf
阿里通义升级Fun-ASR,垂直领域识别率提升15%以上

快速阅读: 阿里通义推出Fun-ASR语音识别大模型,通过上下文感知与高精度转写,实现家装、保险等行业语音识别准确率超15%提升,创新引入RL技术减少误差,支持多场景应用。

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。

作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录,显著优化特定场景下的关键词识别效果。

针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点,研发团队创新性引入强化学习(RL)技术,通过动态优化策略减少识别误差,系统稳定性与可靠性获实质性提升。值得关注的是,模型在四川话、粤语、闽南语等方言识别中表现优于同类产品,同时适应远场拾音、近场降噪等复杂声学环境,覆盖会议室、工位、超市、户外等多元场景。

训练数据层面,Fun-ASR基于上亿小时音频数据构建,深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势,例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。

阿里通义技术团队表示,Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地,其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。

(以上内容均由Ai生成)

你可能还想读

openEuler发布首款SuperPoD就绪操作系统

openEuler发布首款SuperPoD就绪操作系统

快速阅读: 据最新消息,openEuler峰会2025在京举行,发布面向AI集群的24.03 LTS SP3版本及全栈AI方案,AMD等加入社区,全球三大芯片厂商齐聚,推动开源操作系统在多领域部署超1600万套。 11月14日至15日,操作 […]

发布时间:2025年12月10日
Netcall收购Jadu强化AI与数字能力

Netcall收购Jadu强化AI与数字能力

快速阅读: 12月10日消息,Netcall公司近日收购英国数字体验平台Jadu Holdings Limited,旨在增强其Liberty平台的数字化与AI能力,拓展英国地方政府及美国等国际市场,提升盈利与财务稳定性。 英国数字体验平台提 […]

发布时间:2025年12月10日
Pine Labs推印度首个AI账单支付助手

Pine Labs推印度首个AI账单支付助手

快速阅读: 最新消息显示,Pine Labs旗下Setu推出印度首个智能代理账单支付服务,可自动抓取账单、识别异常费用并在用户设定限额内完成支付,目前已上线Claude和ChatGPT平台。 12月10日,Pine Labs旗下API驱动平 […]

发布时间:2025年12月10日
IBM豪掷110亿美元收购Confluent加码AI数据流

IBM豪掷110亿美元收购Confluent加码AI数据流

快速阅读: 12月10日消息,IBM以110亿美元收购Confluent,获得Apache Kafka商业平台控制权,补足实时数据传输能力,结合红帽与HashiCorp技术,构建覆盖混合云环境的完整AI中间件体系。 国际商业机器公司(IBM […]

发布时间:2025年12月10日
2026年软件工程将全面迈入AI原生时代

2026年软件工程将全面迈入AI原生时代

快速阅读: 据媒体报道,荷兰科技企业Xebia推出AI原生工程平台ACE,可自动化50%至60%开发流程,提升交付速度40%、现代化效率70%,推动软件工程全面智能化转型。 随着人工智能技术加速演进,软件工程正迈向“AI原生”新阶段。业界观 […]

发布时间:2025年12月10日
微软宣布175亿美元投资印度AI基建

微软宣布175亿美元投资印度AI基建

快速阅读: 消息人士透露,微软宣布投资175亿美元支持印度AI基础设施建设,系其亚洲最大单笔投资,将分四年推进海得拉巴云区域等项目,助力构建“AI优先”生态体系。 微软公司近日宣布计划投资175亿美元,用于支持印度人工智能基础设施建设。该公 […]

发布时间:2025年12月10日
卡塔尔MCIT签约多家科技巨头推进AI政务转型

卡塔尔MCIT签约多家科技巨头推进AI政务转型

快速阅读: 据了解,卡塔尔通信和信息技术部与Malomatia、谷歌云、微软等六家企业签署战略合作协议,纳入GovAI计划,推动政府AI应用及数字项目建设,助力实现2030国家愿景。 卡塔尔通信和信息技术部近日宣布,与多家本地及国际科技企业 […]

发布时间:2025年12月10日
沃达丰卡塔尔高管开讲AI与网络安全

沃达丰卡塔尔高管开讲AI与网络安全

快速阅读: 据了解,沃达丰卡塔尔首席技术官博克托在巴尔赞大学学院讲座中指出,AI驱动的网络攻击正重塑安全威胁格局,运营商需借力机器学习与预测分析提升防御韧性,并加强产学研合作以支撑卡塔尔国家愿景2030。 近日,沃达丰卡塔尔公司首席技术官拉 […]

发布时间:2025年12月10日