您的 AI 有一个最喜欢的意见 — 但这不是您的意见

发布时间:2025年2月18日    来源:szf
您的 AI 有一个最喜欢的意见 — 但这不是您的意见

快速阅读: 据《黑客 Noon》最新报道,作者安德鲁·J·彼得森指出,尽管大型语言模型(LLMs)在回忆训练数据方面表现良好,但在长尾知识和多样性上仍存在不足。这些模型容易受偏见影响,且难以解释其内部机制。研究尝试通过上采样和Shapley值等方法解决这些问题,但进展有限。此外,LLMs对英语的过度依赖也是一个隐忧。该论文可在arxiv网站上以CC BY-NC-SA 4.0许可证发布。

作者:安德鲁·J·彼得森,普瓦捷大学 ([email protected])。链接表 摘要 和 引言 相关工作 媒体、过滤气泡和 回音室 网络效应与信息级联 模型崩溃 新的 AI 模型 如 LLMs 并未 免于 在 机器学习 算法 中 识别 和 测量 到 的 问题 (Nazer 等,2023年),这些问题 自 至少 1930年代 以来 就 一直 困扰 着 现实世界 中 的 预测算法 (Christian,2021年,第2章)。不出所料,LLMs 在 回忆 训练 数据 中 频繁 出现 的 事实 方面 表现 更好,但在 长尾 知识 方面 则 存在 困难 (Kandpal 等,2023年)。Das 等人 (2024年)指出,LLMs 在 尝试 生成 类似 人类 文本 时 存在 一系列 不足 ,例如 低估 少数 群体 的 观点 ,并 将 “ 积极 ” 文本 的 概念 简化 为 仅仅 表达 “ 快乐 ” 。最近 的 研究 试图 通过 各种 方法 来 解决 这些 问题 ,例如 通过 上采样 来 处理 那些 预测 效果 不佳 的 未充分 表示 的 特征 (Gesi 等,2023年), 或 使用 Shapley 值 评估 输入 数据 的 重要性 (Karlas 等,2022年)。然而,迄今为止 对 LLMs 的 机制 解释 性 研究 表明,尽管 我们 对 它们 的 理解 有所 提高,但仍 非常 有限 (例如,Kramar 等,2024年;Wu 等,2023年)。因此,直接 克服 这些 偏见 的 方法,至少 目前 还 遥不可及 。最后,虽然 大多数 关注点 自然 集中 在 明显 的 种族 和 性别 偏见 上,但 输出 内容 和 形式 中 也 可能 存在 广泛 但 不 那么 显而易见 的 偏见 。例如,Wendler 等人 (2024年)提供 的 证据 表明,当前 基于 大量 英文 文本 训练 的 LLMs 在 其 潜在 表示 中 “ 依赖 ” 英语,仿佛 英语 是 其 参考 语言 。新的 AI 模型 如 LLMs 并未 免于 在 机器学习 算法 中 识别 和 测量 到 的 问题 (Nazer 等,2023年),这些问题 自 至少 1930年代 以来 就 一直 困扰 着 现实世界 中 的 预测算法 (Christian,2021年,第2章)。不出所料,LLMs 在 回忆 训练 数据 中 频繁 出现 的 事实 方面 表现 更好,但在 长尾 知识 方面 则 存在 困难 (Kandpal 等,2023年)。LLM 输出 多样性 的 一个 特定 分析 领域 是 在 解码 策略 背景 下 按 令牌 逐个 分析 。在 某些 情况下,使用 束 搜索 选择 最 可能 的 下 一个 令牌 可能 会 导致 重复 短语 变得 单调 乏味 (Su 等,2022年)。此外,类似于 瑟隆尼奥斯·蒙克 的 旋律 线条,人类 不会 连续 串接 最 可能 的 词语 序列,而是 偶尔 会 从 低 概率 词 中 抽样,打破 常规 (Holtzman 等,2020年)(引用 Grice,1975年)。本文 可 在 arxiv 网站 上 以 CC BY-NC-SA 4.0 许可证 发布。

(以上内容均由Ai生成)

关键词: Ai喜欢意见

你可能还想读

LEO卫星信号助力弱GPS区域精准导航

LEO卫星信号助力弱GPS区域精准导航

快速阅读: 据最新消息,美国俄亥俄州立大学研究证实,星链与一网等低轨卫星信号可有效补充GPS,在无GNSS环境下将定位误差从超1公里降至约27米,为关键基础设施提供高精度导航备份方案。 日前,美国俄亥俄州立大学研究团队证实,商业低轨(LEO […]

发布时间:2025年12月8日
美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
星舰月球计划更新,SpaceX誓不放弃月球竞争

星舰月球计划更新,SpaceX誓不放弃月球竞争

快速阅读: FSD V14.2.1在标志识别方面改进明显,长期测试者Chuck Cook观察到学校区域行为改善,系统对时间规则认识提高,有助于减少动态环境中的误报。 FSD V14.2.1在标志识别方面也显示出改进。长期测试者Chuck C […]

发布时间:2025年11月30日
太空竞赛再起波澜,SpaceX澄清与NASA合作细节

太空竞赛再起波澜,SpaceX澄清与NASA合作细节

快速阅读: Riot Games计划举办《英雄联盟》人机对抗赛,Grok 5参赛将受限于人类水平,展现AI实时互动能力,有望成最具影响力赛事。 尽管尚未确定具体比赛,但从选手、队伍以及Riot Games的兴趣来看,这一概念有可能实现,成为 […]

发布时间:2025年11月26日
中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

中国广电称合作建设卫星移动互联网,展示业界首款一体化便携基站

快速阅读: 中国广电董事长宋起柱出席5G+工业互联网大会,提出强算注智、数智赋能、深耕特色三大举措,展示5G 700MHz应急基站,推动超高清产业与工业互联网发展。 IT之家 11 月 23 日消息,据人民邮电报报道,中国广电党委书记、董事 […]

发布时间:2025年11月23日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日