语音 – 数智风暴

微软推新AI功能，语音成Windows第三输入方式

快速阅读: 微软推出Windows 11更新，增加语音助手Copilot和Copilot Vision工具，支持语音交互及桌面内容识别，旨在提升用户体验和操作系统智能化水平。微软公司正在努力让人们与电脑对话，押注语音和人工智能软件足够强大 […]

发布时间：2025-10-17 19:53 来源：szf

微软Windows 11 Copilot升级：新增语音和视觉功能

快速阅读: 微软在Windows 11中增加多模态Copilot功能，支持语音对话、屏幕分享和执行操作，强化安全性设计，需用户明确许可，权限可控。新功能将逐步推广至所有Windows 11用户。微软在Windows 11中增加了多模态Co […]

发布时间：2025-10-17 06:18 来源：szf

Windows 11用户可通过语音向Copilot求助解决系统问题

快速阅读: 用户可通过Copilot应用程序解决Windows问题或设置需求，无需最新Insider版本。打开App，点击麦克风图标，语音描述问题，AI将指导正确步骤。即使没有最新的Insider版本或新功能的访问权限，也有其他方法可以获 […]

发布时间：2025-10-15 23:21 来源：szf

高通展望AI时代：语音成为全新交互界面

快速阅读: 高通在Snapdragon峰会宣布，通过高性能低功耗芯片，推动智能手机、PC、汽车等多设备实现无处不在的人工智能，强调生态系统的繁荣需模式和模型无缝集成，智能眼镜有望成未来关键设备。高通在Snapdragon峰会上的核心信息明 […]

发布时间：2025-09-29 11:29 来源：szf

谷歌推出对话式照片编辑功能，Android用户可用语音或文本提需求

快速阅读: 谷歌推出对话式编辑功能，用户可通过语音或文字指令编辑照片，无需手动操作。该功能现已推广至美国Android用户，支持从背景中移除陌生人、调亮颜色等，简化照片编辑过程。你知道在照片上多次点击编辑是多么令人烦恼吗？其实，这并不难。 […]

发布时间：2025-09-24 03:37 来源：szf

英国公司重金悬赏，寻找完美AI语音

快速阅读: 英国初创公司Softvize提供10万英镑奖金，寻找最完美人声以赋予AI生命。其技术提供温暖、同情且清晰的对话，将变革客户服务和心理健康支持领域。活动面向所有人，截止10月20日。英国科尔切斯特一家初创公司提供10万英镑奖金， […]

发布时间：2025-09-19 15:36 来源：szf

开源项目发布“Step-Audio 2 mini”，语音更清晰自然

快速阅读: 阶跃星辰推出Step-Audio2mini开源语音模型，多项国际测试中取得SOTA成绩，具备多模态音频理解、跨语言翻译和情感解析能力，支持音频知识增强，已在GitHub等平台上线。近日，阶跃星辰正式推出最新开源端到端语音大模型 […]

发布时间：2025-09-01 16:17 来源：szf

英国金融科技公司 Cleo 推出具有语音和记忆增强功能的人工智能财务教练

快速阅读: 据《网络新闻》称，英国初创公司克莱奥推出AI预算应用升级版，新增语音交互、长期记忆和推理功能，帮助用户管理财务，应对经济不确定性。CNET和金融Buzz称赞其人性化与趣味性。目前用户超500万，隐私保护是关键。记者获悉，近日， […]

发布时间：2025-07-30 21:47 来源：szf

吉利发布首款智能座舱银河M9实现语音大模型量产

快速阅读: 相关媒体消息，吉利汽车联合阶跃星辰发布行业首个智能体座舱，搭载Step-Audio语音大模型，支持情感对话与个性化服务。同时发布“聪明蛋”Agent OS，具备多模态交互等能力。据官方报道，7月28日，在世界人工智能大会期间， […]

发布时间：2025-07-28 21:30 来源：szf

天猫精灵发布新版本哇哦闺蜜：搭载通义语音模型

快速阅读: 相关媒体消息，天猫精灵推出哇哦AI闺蜜机智界版，配备32英寸大屏、全景音响与多模态交互系统，提供多个版本选择，售价3699元起。近日,天猫精灵官方正式宣布推出新款哇哦AI闺蜜机智界版,这款新品主打“超大AI屏,好视听更智能”, […]

发布时间：2025-07-28 11:35 来源：szf

小米汽车公布车外语音控制专利实现精准唤醒

快速阅读: 据相关媒体报道，小米汽车等公司申请一项车外语音控制专利，利用麦克风阵列采集音频，经处理后精准识别唤醒词，提升车外语音控制准确率。据国家知识产权局中国专利公布公告网报道，7月25日，小米汽车科技有限公司、北京小米移动软件有限公司 […]

发布时间：2025-07-25 20:03 来源：szf

李沐团队发布Higgs Audio v2 开创语音合成新时代

快速阅读: 据相关媒体最新报道，李沐团队发布开源TTS大模型Higgs Audio v2，支持多语言、韵律调整和声音克隆，性能优于GPT-4o-mini-tts，代码已开源。记者获悉，近期，知名AI创业者李沐及其团队Boson.ai发布了 […]

发布时间：2025-07-24 11:33 来源：szf