豆包上线同声传译功能 挑战阿里AI眼镜
快速阅读: 相关媒体消息,字节跳动发布豆包·同声传译模型2.0,提升显著;阿里推出Qwen-MT。多家科技巨头布局语音技术,推动AI硬件发展。
据36氪报道,近日,字节跳动旗下火山引擎正式发布了豆包·同声传译模型Seed LiveInterpret 2.0。该模型在多个Benchmark测试中表现出色,较上一版本有了显著提升。与此同时,阿里巴巴也推出了新的翻译模型Qwen-MT,进一步增强了其翻译能力。
字节跳动和阿里巴巴在语音技术上的持续投入,反映了当前AI行业对语音交互技术的重视。除了这两家公司,科大讯飞、Grok、OpenAI、Meta等国内外科技巨头也在积极布局语音类赛道。这些公司不仅在技术上不断创新,还在探索将语音技术应用于各类硬件产品中,如AI眼镜、耳机等,以提升用户体验。
豆包同传模型2.0的推出,标志着字节跳动在语音交互技术上取得了重要进展。该模型能够实现低延迟、高质量的中英文同声传译,并支持实时音色克隆。尽管在多语言支持方面与Meta的SeamlessStreaming相比仍有差距,但在用户体验上已经接近国际先进水平。
语音交互技术的发展,不仅为用户提供更加自然的沟通方式,也为AI硬件产品的商业化开辟了新的路径。随着技术的不断成熟,预计未来将有更多的AI硬件产品问世,推动语音交互成为下一代AI产品的重要交互方式。
(以上内容均由AI生成)