AI 生成信息的危险

发布时间:2025年2月18日    来源:szf
AI 生成信息的危险

快速阅读: 据《黑客 Noon》最新报道,本文研究了人工智能如何通过降低获取信息成本,影响公共知识的分布。结果显示,过度依赖AI生成内容会导致边缘化和罕见观点的缺失,使公共知识偏离真相。研究发现,当AI生成内容的价格折扣越大,公共知识与真实分布的差距也越大。此外,AI截断程度和更新速度也会影响知识崩塌的程度。

作者:安德鲁·J·彼得森,普瓦捷大学 ([email protected])。

链接表摘要和引言

相关工作

媒体、过滤气泡和回音室

网络效应与信息级联

知识崩塌模型

已知的大型语言模型偏差

知识崩塌模型结果

讨论与参考文献

附录

比较尾部宽度定义

知识崩塌结果

我们主要关注的观点是,人工智能通过降低获取某些类型信息的成本,只能让我们变得更好。与关于模型崩溃的文献不同,我们考虑了战略人类在何种条件下可能会寻求维持知识分布完整性的输入数据。因此,我们首先考虑不同的折扣率。首先,我们展示了经过100轮后公共知识的核密度估计(图3)。作为基线,当不使用AI时没有折扣(折扣率为1),那么如预期的那样,公共知识收敛到真实分布。然而,随着AI降低了截断知识的成本,公共知识的分布向中心集中,尾部知识被低估。在这种情况下,过度依赖AI生成的内容会逐渐导致边缘化和罕见观点的缺失,这些观点维持着对世界的全面视角。固定特定参数,我们可以感受到依赖AI的影响大小。例如,在我们的默认模型中,经过九代之后,如果没有AI折扣,公众分布与真实分布之间的海林格距离仅为0.09。当AI生成的内容便宜20%(折扣率为0.8)时,该距离增加到0.22,而50%的折扣使距离增加到0.40。因此,虽然廉价的AI近似可能被认为只会增加公共知识,但在这种情况下,由于依赖AI,公共知识与真相的距离增加了2.3倍或3.2倍。

对于后续结果,我们绘制了100轮结束时公共知识与真实分布之间的海林格距离。首先,我们在图4中考察了更新相对样本值的重要性和折扣因子的关系。也就是说,我们将个体不更新前几轮创新价值的情况(学习率接近零,例如lr = 0.001)与快速更新的情况(此处lr = 0.1)进行比较。如上所述,AI生成内容越便宜(用颜色表示折扣率),公共知识就越倾向于向中心集中。同时,当个体更新相对从AI学习的价值较慢时(在图中更靠左的位置),公共知识也越倾向于向中心集中。我们也观察到了一种权衡,即更快地更新AI生成内容的相对价值可以补偿更大的价格差异。相反,如果折扣率不是太极端,即使缓慢更新相对价值也不会造成太大伤害。

在图5中,我们考虑了AI生成内容截断程度变化对知识崩塌的影响。直观地说,极端截断(σtr的小值)对应于AI仅总结最明显或常见的观点的情况。较少极端的截断对应于AI能够代表多种观点,并排除极罕见或深奥的观点的想法。自然,在后一种情况下(例如,如果AI将分布截断至平均值的两个标准差之外),影响最小。如果AI截断超出平均值0.25个标准差的知识,影响很大,但一旦折扣较小(特别是如果没有世代效应),这至少会有所缓解。

我们在图6中比较了错误世代累积的影响。如果没有世代变化,最坏的情况下也只是减少了截断限制外的公共知识尾部。在这种情况下,分布是稳定的,不会“崩塌”。

0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00

截断

0.2 0.3 0.4 0.5 0.6

海林格距离

折扣因子

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

图5:折扣率与截断限制

本文可在arxiv上获得,采用CC BY-NC-SA 4.0许可证。

[9] 即使没有折扣,偶尔会有来自截断分布的样本,但仅足以表明它们的价值低于全分布样本。

[10] 在平均值的0.75个标准差处截断,每10轮一代,学习率为0.05。

[11] 即使在这里也有来自截断分布的样本——仅足以表明它们的价值低于全分布样本。

(以上内容均由Ai生成)

关键词: Ai信息危险生成

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日