ChatGPT语音模式:更自然的对话体验

发布时间:2025年11月4日    来源:szf
ChatGPT语音模式:更自然的对话体验

快速阅读: 用户分享了对ChatGPT语音模式的积极体验,指出其能捕捉停顿和模糊想法,使对话更自然,适用于开车、做饭等多种场合,提高了交流的便捷性和效率。

多年来我一直使用语音助手,虽然它们确实提供了一些帮助,但我总是感到沮丧,因为它们经常在我话没说完时就打断我,或者完全听不懂我在说什么。当我尝试ChatGPT的语音模式时,并没有抱太大希望,但这次我从未如此高兴地发现自己错了。语音模式不仅让我能够与聊天机器人交谈,它更像是真实的对话。

语音模式能捕捉到停顿、模糊的想法,甚至是像“嗯”这样的填充词,而不会中断对话流程。无论是在开车、做饭还是尝试多任务处理,我都可以自然地说话并获得有用的答案,无需拿起手机。这不仅仅比打字更快——感觉更容易、更直观,也更高效。如果你还没有试过,以下是你应该尝试ChatGPT语音模式的理由。

不要错过:

– 什么是ChatGPT?你需要了解的人工智能聊天机器人的所有信息

– 除了OpenAI的ChatGPT,Google的Gemini Live也提供了类似的功能,Anthropic的Claude在其移动应用程序中推出了语音模式测试版,甚至可以在屏幕上显示要点。Perplexity的iOS和Android助手同样可以回答口头提问,并根据命令启动如OpenTable或Uber等应用。

尽管大家都在努力实现实时人工智能对话,但ChatGPT仍然是我的首选。无论你选择哪个聊天机器人,不妨暂停打字,试试语音选项。你会发现它比想象中更有用。

(披露:CNET的母公司Ziff Davis于4月对OpenAI提起诉讼,指控其在训练和操作人工智能系统时侵犯了Ziff Davis的版权。)

观看视频:

ChatGPT的病毒功能:将人变成行动人物

01:19

语音模式究竟是什么?

语音聊天(或称“语音对话”)是ChatGPT的免手动模式,允许你通过语音与AI模型交流,无需打字。在移动、桌面和网络应用中,每个对话底部右下角都有一个语音图标。点击该按钮,你可以大声说出问题,ChatGPT会将其转录、分析并回复。一旦它完成发言,就会再次开始监听,从而形成自然的来回对话。

请注意:

语音模式基于与常规ChatGPT相同的大型语言模型运行,因此仍可能出现幻觉或事实错误。对于重要信息,你应该始终进行双重检查。

OpenAI提供了两种版本的语音对话:

– 标准语音(默认的免费轻量级选项)

– 高级语音(仅限付费用户)

标准语音首先将你的语音转换为文本,并通过GPT-4o(和GPT-4o迷你版)处理,回应时间稍长。高级语音则使用原生多模态模型,意味着它“听到”你说话并生成音频,因此对话更加自然且实时。它可以捕捉到除词语本身外的其他线索,如说话速度或声音中的情感,并据此做出调整。

注意:

免费用户可以访问每日高级语音预览。

Nelson Aguilar/CNET

你应该开始使用ChatGPT语音模式功能的7个理由

1. 它真正实现了对话

与打字不同,当我和ChatGPT交谈时,我不必寻找合适的词汇或每次打错字后退格。我只是像与朋友或家人交谈那样自然地说出自己的想法,包括“嗯”、“啊”等不连贯的停顿。语音模式能够应对我的半成品思想,并以完整的答案或进一步的问题回应,帮助我更精确地表达需求。这种轻松的互动比打字更自然。

2. 你可以免手动使用ChatGPT

当然,我仍然需要打开ChatGPT应用并点击语音模式按钮来开始,但一旦开始,我就可以不用手继续与AI聊天机器人的对话。例如,在堵车时,我可以规划今年晚些时候想要的度假行程。我可以询问航班、酒店、地标、餐厅等信息,无需触碰手机,这些对话会被保存在应用中,这样我不必记住ChatGPT告诉我的每一件事。

3. 它适合用作实时翻译学习新语言

我之前提到过,我使用语音模式练习语言,这正是它的强项。我可以讲英语,让ChatGPT用完美的波兰语回应,还会提供发音提示。只需向语音模式询问:“你能帮我练习(语言)吗?”它会给出几种帮助方式,比如对话启动器、基础词汇或数字。它还能记住你上次练习的位置,因此你可以像上课一样逐步学习,无需Duolingo。

4. 获取关于现实世界事物的答案

这一功能专属于高级语音模式,但我认为这是语音模式中最吸引我的特点。得益于其多模态的强大能力,我可以通过开启手机摄像头或拍摄视频/照片来请求ChatGPT的帮助。例如,我在一家旧货店发现了一幅画作,难以辨认其来源,而店主对此也一无所知。我随即启动了语音聊天,开启了摄像头,并询问这幅画的出处。几秒钟内,ChatGPT便告知了我画作的名称、作者以及创作时间。

对于视力障碍或患有阅读障碍的人来说,语音模式是一个更好的选择。通过语音模式,系统可以将您的语音转录为文字,并以您选定的速度(可以在设置中调整或要求ChatGPT放慢速度)朗读答案。这种无需手动操作的功能也极大地帮助了有运动技能挑战的人群,只需轻触屏幕即可开始和结束操作,无需在键盘上进行大量打字。

当灵感涌现时,我的思维速度往往超过了打字速度,这时ChatGPT的语音模式就非常适合用来快速构思故事点子、规划客厅布局或是决定一周内的菜单。因为我在大声思考而不是盯着手机屏幕,所以想法能够更加流畅和迅速地产生,特别是借助ChatGPT即时的后续提问,有助于保持思路的连贯性,直到形成一个完整的构想。

即时听取摘要也是语音模式的一大优势。您可以将一个90页的PDF文件上传至聊天框,比如电影剧本或教科书,要求ChatGPT进行摘要并朗读给您听,同时您可以做其他事情,比如叠衣服。这就像是将任何文档(甚至维基百科页面)转化为按需播放的播客。

语音模式不仅仅是一个有趣的小功能;它是一种更快捷、更自然的使用ChatGPT的方式。无论是翻译路牌、头脑风暴还是大声浏览新闻,与ChatGPT对话的感觉更像是与一位知识渊博的专家进行交流,而非使用一个聊天机器人。一旦习惯了大声思考,您可能会不再依赖键盘。

(以上内容均由Ai生成)

你可能还想读

英财政拨款助力警用科技升级,包括面部识别与无人机应用

英财政拨款助力警用科技升级,包括面部识别与无人机应用

快速阅读: 英国财政部在2024-2025财年提供5550万英镑,四年共2.34亿英镑,资助警察技术投资,内政部推广实时面部识别、无人机、自动化公众联系和人工智能等技术。 英国独立公共支出监督机构表示,在2024-2025财政年度,财政部在 […]

发布时间:2025年11月5日
康奈尔教授开发多感官学习AI系统

康奈尔教授开发多感官学习AI系统

快速阅读: 康奈尔大学安德鲁·欧文斯教授正开发一种能看、听、触的人工智能系统,模仿儿童学习方式,使AI更直观。该研究已产生成果,如为无声视频生成音轨。 ITHACA, N.Y. — 康奈尔大学的一位教授正在开发一种能够看、听、触的人工智能系 […]

发布时间:2025年11月5日
AI不会取代你,但会用AI的人将超越你

AI不会取代你,但会用AI的人将超越你

快速阅读: 首席收入官指出,面对AI兴起,关键在于适应而非恐惧。AI改变任务而非取代人类,学会合作可保职位并扩展职能。 作为一家在科技与教育之间架起桥梁的公司的首席收入官,我经常被问及三个相同的问题:“人工智能会取代我的工作吗?”、“人工智 […]

发布时间:2025年11月5日
工会合同保护工人免受AI威胁,AFL-CIO主席呼吁设立严格监管

工会合同保护工人免受AI威胁,AFL-CIO主席呼吁设立严格监管

快速阅读: AFL-CIO主席莉兹·舒勒强调工会合同是保护工人免受AI滥用的关键,主张将AI转化为对工人有利的工具,同时讨论了教皇利奥十四世支持工人的教学文件。 去年SAG-AFTRA罢工的一个主要问题是人工智能如何被用来破坏艺术。AFL- […]

发布时间:2025年11月5日
也门萨那大学举办AI与信息技术文凭项目评审会

也门萨那大学举办AI与信息技术文凭项目评审会

快速阅读: 萨那大学举办研讨会,审查并完善“人工智能”和“信息技术”专业文凭课程,旨在培养具备必备技能的毕业生,满足劳动力市场需求。校长强调课程提升重要性,质量中心和计算机中心参与其中。 萨那 – 萨巴:周二,萨那大学发展与质量保证中心举办 […]

发布时间:2025年11月5日
比特币矿商CleanSpark拓展AI业务,德州获285兆瓦电力支持

比特币矿商CleanSpark拓展AI业务,德州获285兆瓦电力支持

快速阅读: 比特币矿商CleanSpark扩大电力容量28%,购地271英亩建立人工智能数据中心,确保285兆瓦电力供应,标志业务多元化重要进展,应对能源密集型计算需求增长。 比特币矿商CleanSpark在10月将其电力容量扩大了28%, […]

发布时间:2025年11月5日
微软Teams新功能引发隐私担忧,AI监控员工效率

微软Teams新功能引发隐私担忧,AI监控员工效率

快速阅读: 微软Teams集成办公室位置功能,自动记录用户位置,简化协调并支持AI预订;同时推出基准功能,跟踪用户与AI互动评估技术整合。微软及亚马逊等公司推行返岗政策,引发对员工效率军备竞赛及隐私侵犯的担忧。 位置更新只是众多技术中最新的 […]

发布时间:2025年11月5日
OpenAI发布Sora安卓版,生成超现实视频

OpenAI发布Sora安卓版,生成超现实视频

快速阅读: OpenAI在Android平台发布Sora应用,支持生成超逼真AI视频,需邀请码使用。应用扩展至美、加、日、韩等国,提供社区功能。 在iOS平台推出一个月后,OpenAI终于在Android平台上发布了其Sora应用程序,让更 […]

发布时间:2025年11月5日