标签: 语音
-
微软推新AI功能,语音成Windows第三输入方式
快速阅读: 微软推出Windows 11更新,增加语音助手Copilot和Copilot Vision工具,支持语音交互及桌面内容识别,旨在提升用户体验和操作系统智能化水平。 微软公司正在努力让人们与电脑对话,押注语音和人工智能软件足够强大 […]
发布时间:2025-10-17 19:53 来源:szf -
微软Windows 11 Copilot升级:新增语音和视觉功能
快速阅读: 微软在Windows 11中增加多模态Copilot功能,支持语音对话、屏幕分享和执行操作,强化安全性设计,需用户明确许可,权限可控。新功能将逐步推广至所有Windows 11用户。 微软在Windows 11中增加了多模态Co […]
发布时间:2025-10-17 06:18 来源:szf -
Windows 11用户可通过语音向Copilot求助解决系统问题
快速阅读: 用户可通过Copilot应用程序解决Windows问题或设置需求,无需最新Insider版本。打开App,点击麦克风图标,语音描述问题,AI将指导正确步骤。 即使没有最新的Insider版本或新功能的访问权限,也有其他方法可以获 […]
发布时间:2025-10-15 23:21 来源:szf -
高通展望AI时代:语音成为全新交互界面
快速阅读: 高通在Snapdragon峰会宣布,通过高性能低功耗芯片,推动智能手机、PC、汽车等多设备实现无处不在的人工智能,强调生态系统的繁荣需模式和模型无缝集成,智能眼镜有望成未来关键设备。 高通在Snapdragon峰会上的核心信息明 […]
发布时间:2025-09-29 11:29 来源:szf -
谷歌推出对话式照片编辑功能,Android用户可用语音或文本提需求
快速阅读: 谷歌推出对话式编辑功能,用户可通过语音或文字指令编辑照片,无需手动操作。该功能现已推广至美国Android用户,支持从背景中移除陌生人、调亮颜色等,简化照片编辑过程。 你知道在照片上多次点击编辑是多么令人烦恼吗?其实,这并不难。 […]
发布时间:2025-09-24 03:37 来源:szf -
英国公司重金悬赏,寻找完美AI语音
快速阅读: 英国初创公司Softvize提供10万英镑奖金,寻找最完美人声以赋予AI生命。其技术提供温暖、同情且清晰的对话,将变革客户服务和心理健康支持领域。活动面向所有人,截止10月20日。 英国科尔切斯特一家初创公司提供10万英镑奖金, […]
发布时间:2025-09-19 15:36 来源:szf -
开源项目发布“Step-Audio 2 mini”,语音更清晰自然
快速阅读: 阶跃星辰推出Step-Audio2mini开源语音模型,多项国际测试中取得SOTA成绩,具备多模态音频理解、跨语言翻译和情感解析能力,支持音频知识增强,已在GitHub等平台上线。 近日,阶跃星辰正式推出最新开源端到端语音大模型 […]
发布时间:2025-09-01 16:17 来源:szf -
英国金融科技公司 Cleo 推出具有语音和记忆增强功能的人工智能财务教练
快速阅读: 据《网络新闻》称,英国初创公司克莱奥推出AI预算应用升级版,新增语音交互、长期记忆和推理功能,帮助用户管理财务,应对经济不确定性。CNET和金融Buzz称赞其人性化与趣味性。目前用户超500万,隐私保护是关键。 记者获悉,近日, […]
发布时间:2025-07-30 21:47 来源:szf -
吉利发布首款智能座舱 银河M9实现语音大模型量产
快速阅读: 相关媒体消息,吉利汽车联合阶跃星辰发布行业首个智能体座舱,搭载Step-Audio语音大模型,支持情感对话与个性化服务。同时发布“聪明蛋”Agent OS,具备多模态交互等能力。 据官方报道,7月28日,在世界人工智能大会期间, […]
发布时间:2025-07-28 21:30 来源:szf -
天猫精灵发布新版本哇哦闺蜜:搭载通义语音模型
快速阅读: 相关媒体消息,天猫精灵推出哇哦AI闺蜜机智界版,配备32英寸大屏、全景音响与多模态交互系统,提供多个版本选择,售价3699元起。 近日,天猫精灵官方正式宣布推出新款哇哦AI闺蜜机智界版,这款新品主打“超大AI屏,好视听更智能”, […]
发布时间:2025-07-28 11:35 来源:szf -
小米汽车公布车外语音控制专利 实现精准唤醒
快速阅读: 据相关媒体报道,小米汽车等公司申请一项车外语音控制专利,利用麦克风阵列采集音频,经处理后精准识别唤醒词,提升车外语音控制准确率。 据国家知识产权局中国专利公布公告网报道,7月25日,小米汽车科技有限公司、北京小米移动软件有限公司 […]
发布时间:2025-07-25 20:03 来源:szf -
李沐团队发布Higgs Audio v2 开创语音合成新时代
快速阅读: 据相关媒体最新报道,李沐团队发布开源TTS大模型Higgs Audio v2,支持多语言、韵律调整和声音克隆,性能优于GPT-4o-mini-tts,代码已开源。 记者获悉,近期,知名AI创业者李沐及其团队Boson.ai发布了 […]
发布时间:2025-07-24 11:33 来源:szf