AI社交回复易被识破,情感表达成最大破绽

发布时间:2025年11月8日    来源:szf
AI社交回复易被识破,情感表达成最大破绽

快速阅读: 研究人员发现AI模型在社交媒体上通过过于友好的情感语气易被识破,测试显示AI回复的识别准确率达70%-80%,即使优化后情感表达仍与人类有别。

下次在社交媒体上遇到异常礼貌的回复时,不妨多留意一下。这可能是某个AI模型试图(但未能成功)融入人群的表现。本周三,来自苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员发布了一项研究,揭示了AI模型在社交媒体对话中仍容易被区分出来,其中过于友好的情感语气是最明显的线索。该研究测试了九个开放权重模型在Twitter/X、Bluesky和Reddit上的表现,发现研究人员开发的分类器能够以70%到80%的准确率识别出AI生成的回复。

这项研究引入了作者所称的“计算图灵测试”,用于评估AI模型如何接近人类语言。与依赖于人类主观判断文本是否真实不同,这一框架利用自动化分类器和语言分析来识别机器生成内容与人类创作内容之间的特定特征差异。“即使经过校准,大型语言模型的输出仍然明显不同于人类文本,特别是在情感语气和情感表达方面。”研究人员写道。由苏黎世大学的尼科洛·帕甘领导的团队测试了各种优化策略,从简单的提示到微调,但发现深层的情感线索依然可靠地表明在线文本互动是由AI聊天机器人而非人类撰写。

研究中的毒性特征

在这项研究中,研究人员测试了九个大型语言模型:Llama 3.1 8B、Llama 3.1 8B Instruct、Llama 3.1 70B、Mistral 7B v0.1、Mistral 7B Instruct v0.2、Qwen 2.5 7B Instruct、Gemma 3 4B Instruct、DeepSeek-R1-Distill-Llama-8B 和 Apertus-8B-2509。当这些模型被要求对实际用户的社交媒体帖子生成回复时,它们难以匹配人类社交媒体帖子中常见的随意负面情绪和自发情感表达,其毒性评分在所有三个平台上均低于真实的人类回复。

为了应对这一不足,研究人员尝试了包括提供写作样本和上下文检索在内的优化策略,这些策略减少了句子长度或词汇量等结构性差异,但情感语气的变化仍然存在。“我们的全面校准测试挑战了更加复杂的优化必然产生更像人类输出的假设。”研究人员总结道。

(以上内容均由Ai生成)

你可能还想读

谷歌资本支出激增83%,AI服务成增长引擎

谷歌资本支出激增83%,AI服务成增长引擎

快速阅读: 公司本季度资本支出240亿美元,同比增83%,主要用于数据中心扩张和AI硬件发展,推动订单积压增长,超70%与AI服务相关。苹果支付Alphabet 10亿美元升级Siri,助力Alphabet扩展混合云市场份额。 公司本季度资 […]

发布时间:2025年11月9日
中国成全球最大AI专利持有国,占全球60%

中国成全球最大AI专利持有国,占全球60%

快速阅读: 中国成全球最大AI专利持有国,6G专利申请领先,占比40.3%。2025年数字经济强劲,5G用户超11亿,量子计算产业将超115.6亿,电商市场连续12年全球第一。 中国已成为全球最大的人工智能(AI)专利持有国,占全球总量的6 […]

发布时间:2025年11月9日
中国AI快速发展,全面赋能各行业

中国AI快速发展,全面赋能各行业

快速阅读: 中国网络空间研究院在2025年世界互联网大会乌镇峰会发布报告,指出AI技术在中国取得突破,应用加速扩展,成为推动实体经济智能化升级的核心驱动力,同时强调AI治理的重要性。 杭州,11月8日(新华社)——据中国网络空间研究院在浙江 […]

发布时间:2025年11月9日
专家探讨AI并非所有自动化任务的最佳选择

专家探讨AI并非所有自动化任务的最佳选择

快速阅读: Axonius首席信息安全官Liz Morton等专家讨论指出,尽管AI工具在企业中展现强大能力,但在某些自动化任务中,传统IT工具因更高效率而成为更优选择。 2025年,我们几乎无法避开人工智能。尽管自主AI代理和智能工具在企 […]

发布时间:2025年11月9日
专家探讨AI非万能,传统自动化工具仍有优势

专家探讨AI非万能,传统自动化工具仍有优势

快速阅读: Axonius首席信息安全官Liz Morton等专家讨论2026年IT自动化趋势,指出尽管AI广泛应用于企业,但在特定任务上传统自动化工具仍更高效。 2025年,我们已经到了几乎无法避开人工智能的地步。尽管自主AI代理和智能工 […]

发布时间:2025年11月9日
中国AI新模型免费发布,性能超越GPT-5和Sonnet 4.5

中国AI新模型免费发布,性能超越GPT-5和Sonnet 4.5

快速阅读: 周四,中国公司Moonshot发布Kimi K2思考模型,该模型在多项基准测试中超越GPT-5和Sonnet 4.5,且开源免费。训练成本仅460万美元,挑战美国专有模型。 周四,Moonshot发布了其新的Kimi K2思考模 […]

发布时间:2025年11月9日
AI重塑工作与协作:从助手到伙伴的转变

AI重塑工作与协作:从助手到伙伴的转变

快速阅读: 2025年TechSparks会议讨论AI代理如何改变企业协作与生产力。专家们分享了AI在企业中的应用前景,强调了安全、情境感知的重要性,并探讨了AI与人类的合作模式。 随着代理型人工智能从任务执行者转变为自主合作者,它正在重塑 […]

发布时间:2025年11月9日
GE Aerospace与Shield AI合作,F110发动机助力X-BAT项目

GE Aerospace与Shield AI合作,F110发动机助力X-BAT项目

快速阅读: GE Aerospace与Shield AI合作开发X-BAT垂直起降战斗机,采用F110-GE-129发动机,增强垂直飞行和水平机动性,旨在提升自主系统能力。 GE Aerospace与Shield AI达成协议,共同开发Sh […]

发布时间:2025年11月9日