Pangram 在 AI 文本检测中表现卓越,假阳性假阴性率几乎为零

发布时间:2025年11月3日    来源:szf
Pangram 在 AI 文本检测中表现卓越,假阳性假阴性率几乎为零

快速阅读: 芝加哥大学研究显示,Pangram在AI文本检测中表现优异,FPR和FNR低至0.01以下,尤其在中长文本上几乎无误。相比,OriginalityAI和GPTZero在短文本检测中效果较差。Pangram的识别成本较低,研究呼吁定期审计以应对未来挑战。

最近,芝加哥大学的一项研究揭示了市场上各种商业AI文本检测工具之间的显著差异。研究团队构建了一个包含1992篇由人类撰写的文本数据集,涵盖亚马逊产品评论、博客文章、新闻报道、小说摘录、餐厅评论和简历等六类文本。同时,他们利用了四种领先的语言模型——GPT-41、Claude Opus4、Claude Sonnet4和Gemini2.0Flash,生成了相应的AI写作样本。

为了评估这些检测工具的性能,研究团队主要关注两个指标:假阳性率(FPR)和假阴性率(FNR)。FPR用于衡量人类文本被误标为AI生成的频率,而FNR则反映AI文本未被检测出的比例。在这次对比中,商业检测工具Pangram表现出色。对于中长文本,Pangram的FPR和FNR接近于零;在短文本方面,其错误率也普遍低于0.01,只有Gemini2.0Flash在餐厅评论中的FNR为0.02。

其他检测工具如OriginalityAI和GPTZero的表现略逊一筹,尽管在较长文本上的FPR保持在0.01以下,但在极短文本方面的表现不尽理想。此外,这些工具对“人性化”工具生成的AI文本也较为敏感。

Pangram在识别AI生成文本方面表现出色,所有四种模型生成的文本FNR均未超过0.02。相比之下,OriginalityAI的表现受生成模型的影响较大,而GPTZero在不同模型上的表现较为稳定,但依然不及Pangram。

研究团队还测试了各检测工具对StealthGPT工具的抵抗能力,该工具能够使AI生成的文本更难以被检测。Pangram在这些测试中表现稳健,而其他检测工具则面临较大挑战。

从经济效益来看,Pangram的平均识别成本为每正确识别一条AI文本0.0228美元,大约是OriginalityAI的一半和GPTZero的三分之一。研究提出了“政策上限”的概念,允许用户设定最大可接受的假阳性率,以更好地调整检测工具的使用。

研究团队警告称,这些结果仅反映了当前的情况,未来可能会在检测工具、新AI模型和规避工具之间上演一场“军备竞赛”。他们建议定期进行透明的审计,以适应这一快速发展的领域。

(以上内容均由Ai生成)

关键词: AiPangram文本检测

你可能还想读

研究显示:代码生成AI短期内不会取代人类开发者

研究显示:代码生成AI短期内不会取代人类开发者

快速阅读: 研究显示,编码代理在人类指导下表现最佳,缺乏指导时推理能力下降。AI编码需人类监督以保证代码质量、安全性和可维护性,沃尔玛等企业采用混合策略,结合AI与人类开发者优势,提高效率和可扩展性。 研究结果显示,编码代理能够在受控环境中 […]

发布时间:2025年11月4日
AI法律平台TrialView获310万英镑投资,加速全球扩张

AI法律平台TrialView获310万英镑投资,加速全球扩张

快速阅读: 法律科技平台TrialView获410万美元投资,计划扩展团队及市场。该平台专为法律案件设计,已实现300万美元年收入,被英国15家顶级律所采用。 法律科技平台TrialView近日获得410万美元(约310万英镑)的投资,旨在 […]

发布时间:2025年11月4日
沙特Echelon与美国Elutions合作,加速中东AI转型

沙特Echelon与美国Elutions合作,加速中东AI转型

快速阅读: 沙特Echelon Digital与美国Elutions签署合作协议,将在中东地区部署Maestro AI平台,提升能效和生产力,支持沙特“2030愿景”。 沙特科技控股公司Echelon Digital Group宣布与美国人 […]

发布时间:2025年11月4日
诺顿扩展AI反诈骗保护功能至全球

诺顿扩展AI反诈骗保护功能至全球

快速阅读: 诺顿宣布其AI驱动的欺诈保护功能全球扩展,涵盖网络、邮件、短信、视频和电话通话,提供高级实时防御,旨在提高全球在线安全标准,保护用户免受复杂欺诈威胁。 诺顿扩展AI驱动的欺诈保护功能 2025年11月4日,星期二,上午8点25分 […]

发布时间:2025年11月4日
戴尔扩展AI数据平台,推动企业AI工厂愿景实现

戴尔扩展AI数据平台,推动企业AI工厂愿景实现

快速阅读: 戴尔科技集团扩展AI数据平台,推出开放式“AI工厂”,整合PowerScale、ObjectScale、Elastic和Starburst技术,提升数据处理能力,帮助企业打破数据孤岛,加速AI应用落地。 戴尔科技集团通过扩展其A […]

发布时间:2025年11月4日
超2800万英国民众用AI管理财务,ChatGPT成首选平台

超2800万英国民众用AI管理财务,ChatGPT成首选平台

快速阅读: 超过2800万英国成年人使用人工智能管理财务,ChatGPT最受欢迎,主要用于预算编制、储蓄规划和金融教育,助力用户每年平均节省399英镑,增强财务韧性。 超过2800万英国成年人现在使用人工智能来帮助管理财务,使个人理财成为全 […]

发布时间:2025年11月4日
AI数学能力显著提升,多项测试成绩亮眼

AI数学能力显著提升,多项测试成绩亮眼

快速阅读: 人工智能在本科水平考试中超越多数学生,尤其在数学方面进步明显。通过GSM8K和MATH题库测试,AI正确率分别达97.1%和87.9%,显著高于2022年水平。 近期,人工智能在各类本科水平的考试中展现出显著的进步,通常能超过大 […]

发布时间:2025年11月4日
Verizon携手AWS打造高容量光纤网络连接AI数据中心

Verizon携手AWS打造高容量光纤网络连接AI数据中心

快速阅读: Verizon Business与亚马逊深化合作,共同开发私有移动边缘计算解决方案,支持AI工作负载增长需求,服务涵盖制造、医疗、零售和娱乐等行业。 “AI将成为商业和社会未来的核心,推动需要相匹配网络的创新。”Verizon […]

发布时间:2025年11月4日