Pangram 在 AI 文本检测中表现卓越,假阳性假阴性率几乎为零

发布时间:2025年11月3日    来源:szf
Pangram 在 AI 文本检测中表现卓越,假阳性假阴性率几乎为零

快速阅读: 芝加哥大学研究显示,Pangram在AI文本检测中表现优异,FPR和FNR低至0.01以下,尤其在中长文本上几乎无误。相比,OriginalityAI和GPTZero在短文本检测中效果较差。Pangram的识别成本较低,研究呼吁定期审计以应对未来挑战。

最近,芝加哥大学的一项研究揭示了市场上各种商业AI文本检测工具之间的显著差异。研究团队构建了一个包含1992篇由人类撰写的文本数据集,涵盖亚马逊产品评论、博客文章、新闻报道、小说摘录、餐厅评论和简历等六类文本。同时,他们利用了四种领先的语言模型——GPT-41、Claude Opus4、Claude Sonnet4和Gemini2.0Flash,生成了相应的AI写作样本。

为了评估这些检测工具的性能,研究团队主要关注两个指标:假阳性率(FPR)和假阴性率(FNR)。FPR用于衡量人类文本被误标为AI生成的频率,而FNR则反映AI文本未被检测出的比例。在这次对比中,商业检测工具Pangram表现出色。对于中长文本,Pangram的FPR和FNR接近于零;在短文本方面,其错误率也普遍低于0.01,只有Gemini2.0Flash在餐厅评论中的FNR为0.02。

其他检测工具如OriginalityAI和GPTZero的表现略逊一筹,尽管在较长文本上的FPR保持在0.01以下,但在极短文本方面的表现不尽理想。此外,这些工具对“人性化”工具生成的AI文本也较为敏感。

Pangram在识别AI生成文本方面表现出色,所有四种模型生成的文本FNR均未超过0.02。相比之下,OriginalityAI的表现受生成模型的影响较大,而GPTZero在不同模型上的表现较为稳定,但依然不及Pangram。

研究团队还测试了各检测工具对StealthGPT工具的抵抗能力,该工具能够使AI生成的文本更难以被检测。Pangram在这些测试中表现稳健,而其他检测工具则面临较大挑战。

从经济效益来看,Pangram的平均识别成本为每正确识别一条AI文本0.0228美元,大约是OriginalityAI的一半和GPTZero的三分之一。研究提出了“政策上限”的概念,允许用户设定最大可接受的假阳性率,以更好地调整检测工具的使用。

研究团队警告称,这些结果仅反映了当前的情况,未来可能会在检测工具、新AI模型和规避工具之间上演一场“军备竞赛”。他们建议定期进行透明的审计,以适应这一快速发展的领域。

(以上内容均由Ai生成)

关键词: AiPangram文本检测

你可能还想读

校园安防技术效果存疑

校园安防技术效果存疑

快速阅读: 据校园安全杂志报道,布朗大学12月13日发生枪击事件,造成2人死亡、9人受伤,校方计划升级门禁与监控系统;专家质疑包括AI武器识别在内的40亿美元校园安防技术缺乏实证,强调“就地封锁”等基础应急措施更为有效。 2025年12月1 […]

发布时间:2025年12月19日
谷歌Gemini推绘图编辑与AI视频验证功能

谷歌Gemini推绘图编辑与AI视频验证功能

快速阅读: 据不完全统计,谷歌近日更新Gemini应用,新增图像标记指令功能,并将SynthID技术扩展至视频领域,以提升AI生成内容的可验证性与透明度,回应社会对生成式AI溯源的关切。 谷歌近日对Gemini应用推出两项更新,旨在提升用户 […]

发布时间:2025年12月19日
多模型协作提升智能合约审计效果

多模型协作提升智能合约审计效果

快速阅读: 据媒体报道,佐治亚理工学院团队提出LLMBugScanner框架,通过集成多个微调大语言模型协同检测以太坊智能合约漏洞,在108份真实合约测试中将准确率提升至约60%,显著优于单模型方案,为区块链安全审计提供新路径。 智能合约漏 […]

发布时间:2025年12月19日
商汤ACE机器人发布三大技术加速具身AI落地

商汤ACE机器人发布三大技术加速具身AI落地

快速阅读: 记者从商汤科技获悉,其旗下ACE Robotics于近日发布ACE具身研发范式、开源世界模型Kairos 3.0及A1具身超脑模块,构建全栈技术链路,支持115个行业场景,推动具身智能产业化发展。 2025年12月18日,商汤科 […]

发布时间:2025年12月19日
火山引擎发布豆包大模型1.8跻身全球多模态AI第一梯队

火山引擎发布豆包大模型1.8跻身全球多模态AI第一梯队

快速阅读: 据火山引擎消息,该公司在12月18日FORCE原动力大会上发布豆包大模型1.8及Seedance 1.5 Pro音视频模型。前者多模态能力全球领先,日均Token使用量突破50万亿;后者支持毫秒级音画同步与方言识别,企业用户可于 […]

发布时间:2025年12月19日
AI预测2026年全球趋势

AI预测2026年全球趋势

快速阅读: 最新消息显示,受传统智慧与现代趋势影响,2026年将聚焦调适与深耕;商业领域强调协作与绿色转型,地缘政治注重文化互信,体育及文化艺术则推崇平衡、真诚与内在力量。 2026年将是一个充满变革与机遇之年。受多重传统智慧视角启发,各方 […]

发布时间:2025年12月19日
奥里萨邦举办区域AI峰会聚焦可持续未来

奥里萨邦举办区域AI峰会聚焦可持续未来

快速阅读: 12月19日消息,印度奥里萨邦在布巴内斯瓦尔启动“2025区域人工智能影响力峰会”,聚焦可持续AI发展与政府治理应用。作为全国首个出台AI政策的地区,该邦正通过“奥里萨AI使命”推动AI在医疗、教育等场景落地,并加强本土人才培养 […]

发布时间:2025年12月19日
IBM将培训500万印度青年掌握AI等前沿技术

IBM将培训500万印度青年掌握AI等前沿技术

快速阅读: 据IBM公司消息,该公司将在印度启动大规模技能发展计划,目标到2030年为500万学习者提供人工智能、网络安全和量子计算等前沿技术培训,依托SkillsBuild平台推动数字教育普惠,并与全印技术教育委员会合作开展课程融合与师资 […]

发布时间:2025年12月19日