AI 如何回收和缩减知识

快速阅读: 据《黑客 Noon》称，本文探讨了知识崩溃现象，即随着技术进步，人类可获取的信息集反而逐渐变窄。文章分析了个体在创新或学习过程中，如何权衡传统方法与AI辅助过程的成本效益。通过模型，研究考察了在何种条件下个体更新能维持社区对真相的准确理解，强调了避免过度依赖“中心”信息的重要性。

作者：安德鲁·J·彼得森，普瓦提埃大学 ([email protected])。

目录摘要和引言相关工作媒体、过滤气泡和回声室网络效应和信息级联模型崩溃已知的大型语言模型偏差知识崩溃模型结果讨论和参考文献附录

比较尾部的宽度定义知识崩溃知识崩溃模型定义知识崩溃定义在其他领域，尤其是在地区内部，情况则不那么明确。历史上，知识并非总是单调进步的，这一点可以从西罗马帝国的衰落、巴格达智慧宫的毁灭以及随后阿拔斯王朝在1258年后的衰落，或者玛雅文明在公元8世纪或9世纪的崩溃中得到证明。或者，以具体的例子来说，古罗马人有一种混凝土配方后来失传了，尽管我们已经取得了进步，但我们还没有重新发现其耐久性的秘密（Seymour等人，2023），与大马士革钢的情况类似（Kurnsteiner等人，2020）。从文化角度来看，有许多语言、文化和艺术实践，以及宗教信仰，曾经由人类社区所持有，但现在这些已经消失，因为它们不再存在于任何已知的来源中（Nettle和Romaine，2000）。个体之间的知识分布也随时间变化。例如，传统的狩猎采集者能够识别数千种不同的植物，并了解它们的药用价值，而今天大多数人类只知道几十种植物及其是否可以在杂货店买到。这可以被视为一种更有效率的信息个体专业化形式，但也可能影响我们对这些物种的价值或森林漫步的看法，或影响科学或政策相关的判断。非正式地说，我们将知识崩溃定义为随着时间和技术进步，人类可获得的信息集逐渐变窄，同时对不同信息集的感知可用性和效用也随之变窄。后者很重要，因为对于许多目的而言，仅仅存在一个能力，比如去档案馆查阅某些信息是不够的。如果所有成员都认为获取某些信息的成本太高或不值得，那么理论上可获得的信息就会被忽视且无用。

模型概览该模型的主要关注点是个体是否决定通过传统方式投资于创新或学习（我们将这两者视为可互换的），通过一种可能更便宜的AI辅助过程，或者根本不进行投资。我们的目的是捕捉例如，有人会进行广泛的档案研究而不是仅仅依赖现成的材料，或者有人愿意花时间阅读一本完整的书而不是只读一个两段的LLM生成的摘要。与研究人员训练的LLM不同，人类在选择可能的输入时具有自主权。因此，模型的关键动态之一是允许理性代理能够预防或纠正过度依赖‘中心’信息带来的扭曲。如果过去的样本忽略了‘尾部’区域，那么这种知识的回报应该相对较高。到他们观察到这一点的程度，个体会愿意付出更多（投入更多的劳动）以从中获利。因此，我们探讨在什么条件下个体之间的这种更新足以保持整个社区对真相的准确理解。投资新信息的成本效益决策取决于该信息的预期价值。任何尝试使用AI进行文本总结等实验的人都会发展出一种直觉，知道何时AI能足够好地提供给定目的的主要思想，以及何时值得直接查看原始资料。我们假设个人无法预见未来，但他们确实共同观察到了前几轮实现的回报。决策还取决于每个个体的类型。具体来说，n个个体的类型Θn是从均值μ=1，标准差σ=0.5的对数正态分布中抽取的。根据他们的效用如何计算（这里不是实质性焦点），这些可以解释为创新的不同预期回报（例如，技术乐观主义者与悲观主义者），或者他们参与创新的能力或意愿。

这反映了公众意识被各种知识主张所淹没，无法逐一评估，因此形成了一种综合共识。与专注于自身专利是否最终产生价值的个人创新者不同，公共领域注意力有限，被迫接受思想市场中的综合贡献。通过改变学习率，我们可以评估拥有更多或更少最新信息对不同信息源价值的影响，在这种情况下，如果个人足够了解信息，他们将通过看到并利用来自尾部区域的知识潜力来避免知识崩溃，即使这些知识相对更昂贵。虽然个人收益基于公共概率密度函数（pdf）向真实pdf的真实移动，但公共pdf是基于所有样本进行更新的。这反映了公众意识被各种知识主张所淹没，无法逐一评估，因此形成了一种综合共识。

(以上内容均由Ai生成)