您的 AI 有一个最喜欢的意见 — 但这不是您的意见

发布时间：2025年2月18日来源：szf

快速阅读: 据《黑客 Noon》最新报道，作者安德鲁·J·彼得森指出，尽管大型语言模型（LLMs）在回忆训练数据方面表现良好，但在长尾知识和多样性上仍存在不足。这些模型容易受偏见影响，且难以解释其内部机制。研究尝试通过上采样和Shapley值等方法解决这些问题，但进展有限。此外，LLMs对英语的过度依赖也是一个隐忧。该论文可在arxiv网站上以CC BY-NC-SA 4.0许可证发布。

作者：安德鲁·J·彼得森，普瓦捷大学 ([email protected])。链接表摘要和引言相关工作媒体、过滤气泡和回音室网络效应与信息级联模型崩溃新的 AI 模型如 LLMs 并未免于在机器学习算法中识别和测量到的问题（Nazer 等，2023年），这些问题自至少 1930年代以来就一直困扰着现实世界中的预测算法（Christian，2021年，第2章）。不出所料，LLMs 在回忆训练数据中频繁出现的事实方面表现更好，但在长尾知识方面则存在困难（Kandpal 等，2023年）。Das 等人（2024年）指出，LLMs 在尝试生成类似人类文本时存在一系列不足，例如低估少数群体的观点，并将 “ 积极 ” 文本的概念简化为仅仅表达 “ 快乐 ” 。最近的研究试图通过各种方法来解决这些问题，例如通过上采样来处理那些预测效果不佳的未充分表示的特征（Gesi 等，2023年），或使用 Shapley 值评估输入数据的重要性（Karlas 等，2022年）。然而，迄今为止对 LLMs 的机制解释性研究表明，尽管我们对它们的理解有所提高，但仍非常有限（例如，Kramar 等，2024年；Wu 等，2023年）。因此，直接克服这些偏见的方法，至少目前还遥不可及。最后，虽然大多数关注点自然集中在明显的种族和性别偏见上，但输出内容和形式中也可能存在广泛但不那么显而易见的偏见。例如，Wendler 等人（2024年）提供的证据表明，当前基于大量英文文本训练的 LLMs 在其潜在表示中 “ 依赖 ” 英语，仿佛英语是其参考语言。新的 AI 模型如 LLMs 并未免于在机器学习算法中识别和测量到的问题（Nazer 等，2023年），这些问题自至少 1930年代以来就一直困扰着现实世界中的预测算法（Christian，2021年，第2章）。不出所料，LLMs 在回忆训练数据中频繁出现的事实方面表现更好，但在长尾知识方面则存在困难（Kandpal 等，2023年）。LLM 输出多样性的一个特定分析领域是在解码策略背景下按令牌逐个分析。在某些情况下，使用束搜索选择最可能的下一个令牌可能会导致重复短语变得单调乏味（Su 等，2022年）。此外，类似于瑟隆尼奥斯·蒙克的旋律线条，人类不会连续串接最可能的词语序列，而是偶尔会从低概率词中抽样，打破常规（Holtzman 等，2020年）（引用 Grice，1975年）。本文可在 arxiv 网站上以 CC BY-NC-SA 4.0 许可证发布。

(以上内容均由Ai生成)