研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

发布时间:2025年10月31日    来源:szf
研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

快速阅读: 宾夕法尼亚州立大学研究显示,对AI不礼貌的提示能提高其准确性,但可能损害用户体验和沟通规范,研究强调了人机交互的复杂性。

研究人员表示,对AI下属采取强硬态度可能比礼貌更有效,但这并不意味着长期而言,粗鲁的态度不会带来后果。宾夕法尼亚州立大学本月早些时候发表的一项新研究发现,随着研究人员的提示变得越来越不礼貌,ChatGPT的4o模型在50个选择题上的表现更好。“非常粗鲁”的回应准确率达到84.8%,比“非常礼貌”的回应高出四个百分点。也就是说,当研究人员用“嘿,杂工,解决这个问题”这样的提示时,大型语言模型的表现优于“您能否好心地解答以下问题?”之类的礼貌提示。

尽管粗鲁的提示通常能获得更准确的回答,但研究者指出,“不文明的交流”可能会产生意外后果。“在人机交互中使用侮辱或贬低的语言,可能会对用户体验、可访问性和包容性产生负面影响,并可能导致有害的沟通规范。”研究者写道。

这项未经同行评审的预印本研究提供了新的证据,表明不仅句子结构,连语气也会影响AI聊天机器人的回答。这或许表明,人机互动比之前认为的更为复杂。此前对AI聊天机器人行为的研究发现,聊天机器人对其接收到的人类信息敏感。例如,宾夕法尼亚大学的研究人员通过应用对人类有效的说服技巧,操纵大型语言模型给出被禁止的回答。另一项研究表明,当大型语言模型持续接收低质量的病毒内容时,会出现类似“脑腐”的持久认知衰退,表现出更高的心理变态和自恋倾向。

宾夕法尼亚州立大学的研究者指出了他们研究的一些局限性,比如相对较小的样本量和主要依赖于一个AI模型——ChatGPT 4o。研究者还提到,更先进的AI模型可能会“忽略语气问题,专注于每个问题的本质”。尽管如此,这项调查增加了人们对AI模型及其复杂性的兴趣。特别是,研究发现,即使在看似简单的多项选择测试中,ChatGPT的回应也会因提示中的细微差异而变化。宾夕法尼亚州立大学信息系统教授阿希尔·库马尔(Akhil Kumar)在电子邮件中告诉《财富》杂志:“长期以来,人们一直希望有对话界面来与机器互动。但现在我们意识到,这种接口也有其缺点,结构化的API也有其价值。”库马尔教授拥有电气工程和计算机科学学位。

(以上内容均由Ai生成)

你可能还想读

英伟达领跑AI芯片市场,台积电成关键角色

英伟达领跑AI芯片市场,台积电成关键角色

快速阅读: 英伟达因AI硬件优势成为科技市场领头羊,高通宣布挑战AI芯片生产。专家讨论AI硬件重要性及未来发展方向,强调散热、定制化和低功耗设计。 在波兰克拉科夫拍摄的一张多重曝光照片中,可以看到手机屏幕上显示了微芯片和英伟达的标志(图片由 […]

发布时间:2025年11月1日
李呼吁APEC拥抱AI变革,共促经济增长

李呼吁APEC拥抱AI变革,共促经济增长

快速阅读: 李在明总统在APEC峰会上呼吁成员国将AI变革视为增长机会,提出“面向所有人的基于人工智能的社会”倡议,强调应对人口老龄化挑战,推动文化产业成为增长引擎。 李在明总统,2025年亚太经济合作组织峰会主席,周六在庆州华白国际会议中 […]

发布时间:2025年11月1日
无需编程技能,AI助力轻松创建应用

无需编程技能,AI助力轻松创建应用

快速阅读: CNET报道,氛围编程通过AI将自然语言转换为代码,使非程序员也能创建应用程序。测试者使用Gemini和Claude成功制作了万圣节活动日历,体验到氛围编程的便捷与高效。 我从未称自己为程序员,尽管过去参加过几门课程。我从摆弄安 […]

发布时间:2025年11月1日
英伟达供韩26万GPU,助力韩国AI产业提速

英伟达供韩26万GPU,助力韩国AI产业提速

快速阅读: 英伟达承诺向韩国提供26万个最新GPU,缓解当地AI产业短缺,助力政府及私营部门推进AI发展,提升国际竞争力。 英伟达承诺提供26万个最新一代图形处理单元,预计这将缓解韩国人工智能产业面临的严重短缺问题。这批供应有望为政府主导的 […]

发布时间:2025年11月1日
英伟达向韩国供应26万AI芯片,助力主权AI计划

英伟达向韩国供应26万AI芯片,助力主权AI计划

快速阅读: 英伟达将向韩国政府及主要企业提供26万个高性能GPU,缓解AI领域GPU短缺,增强韩国AI竞争力,支持人才培养和技术创新。 英伟达将向韩国政府及主要企业提供26万个高性能图形处理器(GPU),用于人工智能领域。这批货物预计能够缓 […]

发布时间:2025年11月1日
ChatGPT等人机对话模型为何难以模仿人类交流

ChatGPT等人机对话模型为何难以模仿人类交流

快速阅读: 挪威科技大学研究发现,大型语言模型在模仿人类对话时存在局限,如过度模仿、填充词使用不当及对话结构处理不佳,导致多数人能区分真伪。 挪威科技大学(NTNU)的研究揭示了大型语言模型在模仿人类对话时的局限性。尽管这些模型在许多方面非 […]

发布时间:2025年11月1日
AMD推AI工厂方案,加速数字转型

AMD推AI工厂方案,加速数字转型

快速阅读: AMD推出“AI工厂”概念,构建全栈计算平台支持AI基础设施建设,强调硬件与开源软件ROCm结合,推动数据中心架构革新及AI创新。 人工智能持续加速各行业的数字化转型,重塑组织构建和扩展现代基础设施的方式。高级微设备公司(Adv […]

发布时间:2025年11月1日
企业AP自动化平台获风投,加速AI创新与市场扩展

企业AP自动化平台获风投,加速AI创新与市场扩展

快速阅读: TranscendAP获Rittenhouse Ventures和Tech Council Ventures领投,未披露金额。平台自2018年推出,通过智能数据捕捉等工作流自动化功能,帮助多行业企业减少应付账款手动处理,降低成本 […]

发布时间:2025年11月1日