智谱AI推新输入法,开源高精度语音识别模型
快速阅读: 据媒体报道,智谱AI发布GLM-ASR系列语音识别模型,含云端高精度版与端侧轻量版,同步开源并推出桌面输入法,支持语音转写、翻译及改写,提升PC端交互体验。
智谱AI近日正式发布GLM-ASR系列语音识别模型,并同步开源相关技术,旨在提升用户语音交互效率。该系列包含云端模型GLM-ASR-2512与端侧轻量化模型GLM-ASR-Nano-2512,分别面向高精度实时识别与本地化部署需求。
其中,GLM-ASR-2512为全球领先的云端语音识别模型,支持多语种、多口音及复杂环境下的实时语音转文字,字符错误率低至0.0717,在多项指标上保持行业领先。与此同时,开源的GLM-ASR-Nano-2512参数规模仅为1.5B,却在开源领域达到当前最优性能(SOTA),部分测试中甚至超越部分闭源模型。该模型可在本地设备运行,兼顾识别精度、隐私安全与低延迟交互。
基于上述技术,智谱AI同步推出桌面端“智谱AI输入法”,支持语音转文字、智能翻译与文本改写等功能,显著提升PC端语音输入体验。目前该输入法已全面开放下载,新用户注册可获2000积分,享受28天免费使用权益。
此次发布标志着国产语音识别技术在精度与实用性方面取得重要进展,有望推动智能人机交互在办公、教育等场景的广泛应用。相关模型已在Hugging Face平台开源,输入法产品亦同步上线官方渠道。
(以上内容均由Ai生成)