研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

发布时间:2025年10月31日    来源:szf
研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

快速阅读: 宾夕法尼亚州立大学研究显示,对AI不礼貌的提示能提高其准确性,但可能损害用户体验和沟通规范,研究强调了人机交互的复杂性。

研究人员表示,对AI下属采取强硬态度可能比礼貌更有效,但这并不意味着长期而言,粗鲁的态度不会带来后果。宾夕法尼亚州立大学本月早些时候发表的一项新研究发现,随着研究人员的提示变得越来越不礼貌,ChatGPT的4o模型在50个选择题上的表现更好。“非常粗鲁”的回应准确率达到84.8%,比“非常礼貌”的回应高出四个百分点。也就是说,当研究人员用“嘿,杂工,解决这个问题”这样的提示时,大型语言模型的表现优于“您能否好心地解答以下问题?”之类的礼貌提示。

尽管粗鲁的提示通常能获得更准确的回答,但研究者指出,“不文明的交流”可能会产生意外后果。“在人机交互中使用侮辱或贬低的语言,可能会对用户体验、可访问性和包容性产生负面影响,并可能导致有害的沟通规范。”研究者写道。

这项未经同行评审的预印本研究提供了新的证据,表明不仅句子结构,连语气也会影响AI聊天机器人的回答。这或许表明,人机互动比之前认为的更为复杂。此前对AI聊天机器人行为的研究发现,聊天机器人对其接收到的人类信息敏感。例如,宾夕法尼亚大学的研究人员通过应用对人类有效的说服技巧,操纵大型语言模型给出被禁止的回答。另一项研究表明,当大型语言模型持续接收低质量的病毒内容时,会出现类似“脑腐”的持久认知衰退,表现出更高的心理变态和自恋倾向。

宾夕法尼亚州立大学的研究者指出了他们研究的一些局限性,比如相对较小的样本量和主要依赖于一个AI模型——ChatGPT 4o。研究者还提到,更先进的AI模型可能会“忽略语气问题,专注于每个问题的本质”。尽管如此,这项调查增加了人们对AI模型及其复杂性的兴趣。特别是,研究发现,即使在看似简单的多项选择测试中,ChatGPT的回应也会因提示中的细微差异而变化。宾夕法尼亚州立大学信息系统教授阿希尔·库马尔(Akhil Kumar)在电子邮件中告诉《财富》杂志:“长期以来,人们一直希望有对话界面来与机器互动。但现在我们意识到,这种接口也有其缺点,结构化的API也有其价值。”库马尔教授拥有电气工程和计算机科学学位。

(以上内容均由Ai生成)

你可能还想读

非洲疾控中心与Zipline签署协议推进无人机医疗物流

非洲疾控中心与Zipline签署协议推进无人机医疗物流

快速阅读: 据非洲疾病预防控制中心消息,该中心近日与齐普林国际公司签署备忘录,计划通过无人机物流技术提升非洲偏远地区医疗物资配送效率及疫情应急响应能力。合作将支持成员国将无人机纳入国家公共卫生体系,强化数据驱动的监测预警,并推动本地能力建设 […]

发布时间:2025年12月16日
AI搜索重塑零售发现格局

AI搜索重塑零售发现格局

快速阅读: 12月16日消息,中小企业凭借高质量内容与规范数据结构,在人工智能时代迅速适配生成式搜索引擎优化策略,超越行业巨头。此举反映出技术变革正重塑商业竞争逻辑,信任与内容权威性成为关键优势。 在人工智能时代,市场竞争格局正发生深刻变化 […]

发布时间:2025年12月16日
海外AI模型在韩国高考数学测试中领先

海外AI模型在韩国高考数学测试中领先

快速阅读: 据科技和ICT部方面消息,韩国国产AI大模型在高丽大学主导的数学能力测评中显著落后于国际主流系统,主要原因是科学训练数据不足。部长裵京勋12月16日表示,将聚焦构建领域专用数据集,并优先发展可部署的轻量级模型。 韩国自主研发的人 […]

发布时间:2025年12月16日
韦氏词典新增“slop”指代低质AI内容

韦氏词典新增“slop”指代低质AI内容

快速阅读: 据语言学者指出,“slop”一词新指AI生成的低质数字内容,因其缺乏原创性且高度同质化,引发公众对信息真实性与网络生态健康的担忧。专家呼吁提升用户媒介素养并强化平台审核机制。 “slop”一词最早在18世纪用来形容稀泥,到19世 […]

发布时间:2025年12月16日
AI生成培训提升钓鱼邮件识别率

AI生成培训提升钓鱼邮件识别率

快速阅读: 据各方消息,意大利巴里大学研究发现,大语言模型生成的通用反钓鱼培训内容可有效提升用户识别能力,个性化策略未显优势,且简洁提示方法效果不逊于复杂方案。 网络钓鱼仍是攻击者常用手段,用户识别能力的任何提升都值得关注。意大利巴里大学近 […]

发布时间:2025年12月16日
英伟达成全球价值最高公司

英伟达成全球价值最高公司

快速阅读: 据胡润研究院发布的报告,受AI芯片与数据中心需求激增推动,英伟达以32.8万亿元企业价值跃居全球高质量企业榜首,超越微软与苹果。中国共有158家企业上榜,占总数的15.8%,其中国企83家;在非上市企业中,OpenAI与字节跳动 […]

发布时间:2025年12月16日
昆仑芯完成股改加速推进上市

昆仑芯完成股改加速推进上市

快速阅读: 据知情人士透露,昆仑芯(北京)科技有限公司正加速推进赴港上市进程,目前已接近完成股份制改造。该公司前身为百度智能芯片部门,2025年营收显著超20亿元,计划2026年提交IPO申请,目标2027年初完成上市。 昆仑芯(北京)科技 […]

发布时间:2025年12月16日
全球首个侵入式脑机接口获批治疗药物成瘾

全球首个侵入式脑机接口获批治疗药物成瘾

快速阅读: 据中国国家药品监督管理局消息,12月15日批准景昱医疗全球首个侵入式脑机接口三类产品,用于治疗难治性阿片类药物成瘾。该系统通过深部脑刺激调节大脑奖赏通路,临床试验显示10年随访戒断率达69%,且无明显认知或功能副作用。 12月1 […]

发布时间:2025年12月16日