您的 AI 有一个最喜欢的意见 — 但这不是您的意见

发布时间:2025年2月18日    来源:szf
您的 AI 有一个最喜欢的意见 — 但这不是您的意见

快速阅读: 据《黑客 Noon》最新报道,作者安德鲁·J·彼得森指出,尽管大型语言模型(LLMs)在回忆训练数据方面表现良好,但在长尾知识和多样性上仍存在不足。这些模型容易受偏见影响,且难以解释其内部机制。研究尝试通过上采样和Shapley值等方法解决这些问题,但进展有限。此外,LLMs对英语的过度依赖也是一个隐忧。该论文可在arxiv网站上以CC BY-NC-SA 4.0许可证发布。

作者:安德鲁·J·彼得森,普瓦捷大学 ([email protected])。链接表 摘要 和 引言 相关工作 媒体、过滤气泡和 回音室 网络效应与信息级联 模型崩溃 新的 AI 模型 如 LLMs 并未 免于 在 机器学习 算法 中 识别 和 测量 到 的 问题 (Nazer 等,2023年),这些问题 自 至少 1930年代 以来 就 一直 困扰 着 现实世界 中 的 预测算法 (Christian,2021年,第2章)。不出所料,LLMs 在 回忆 训练 数据 中 频繁 出现 的 事实 方面 表现 更好,但在 长尾 知识 方面 则 存在 困难 (Kandpal 等,2023年)。Das 等人 (2024年)指出,LLMs 在 尝试 生成 类似 人类 文本 时 存在 一系列 不足 ,例如 低估 少数 群体 的 观点 ,并 将 “ 积极 ” 文本 的 概念 简化 为 仅仅 表达 “ 快乐 ” 。最近 的 研究 试图 通过 各种 方法 来 解决 这些 问题 ,例如 通过 上采样 来 处理 那些 预测 效果 不佳 的 未充分 表示 的 特征 (Gesi 等,2023年), 或 使用 Shapley 值 评估 输入 数据 的 重要性 (Karlas 等,2022年)。然而,迄今为止 对 LLMs 的 机制 解释 性 研究 表明,尽管 我们 对 它们 的 理解 有所 提高,但仍 非常 有限 (例如,Kramar 等,2024年;Wu 等,2023年)。因此,直接 克服 这些 偏见 的 方法,至少 目前 还 遥不可及 。最后,虽然 大多数 关注点 自然 集中 在 明显 的 种族 和 性别 偏见 上,但 输出 内容 和 形式 中 也 可能 存在 广泛 但 不 那么 显而易见 的 偏见 。例如,Wendler 等人 (2024年)提供 的 证据 表明,当前 基于 大量 英文 文本 训练 的 LLMs 在 其 潜在 表示 中 “ 依赖 ” 英语,仿佛 英语 是 其 参考 语言 。新的 AI 模型 如 LLMs 并未 免于 在 机器学习 算法 中 识别 和 测量 到 的 问题 (Nazer 等,2023年),这些问题 自 至少 1930年代 以来 就 一直 困扰 着 现实世界 中 的 预测算法 (Christian,2021年,第2章)。不出所料,LLMs 在 回忆 训练 数据 中 频繁 出现 的 事实 方面 表现 更好,但在 长尾 知识 方面 则 存在 困难 (Kandpal 等,2023年)。LLM 输出 多样性 的 一个 特定 分析 领域 是 在 解码 策略 背景 下 按 令牌 逐个 分析 。在 某些 情况下,使用 束 搜索 选择 最 可能 的 下 一个 令牌 可能 会 导致 重复 短语 变得 单调 乏味 (Su 等,2022年)。此外,类似于 瑟隆尼奥斯·蒙克 的 旋律 线条,人类 不会 连续 串接 最 可能 的 词语 序列,而是 偶尔 会 从 低 概率 词 中 抽样,打破 常规 (Holtzman 等,2020年)(引用 Grice,1975年)。本文 可 在 arxiv 网站 上 以 CC BY-NC-SA 4.0 许可证 发布。

(以上内容均由Ai生成)

关键词: Ai喜欢意见

你可能还想读

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

快速阅读: 国星宇航与北京邮电大学共建语义卫星联合实验室,聚焦语义卫星星座建设等关键技术,加速太空AI技术转化与应用落地,推动6G通信发展。 IT之家 10 月 22 日消息, 国星宇航今日宣布,将携手北京邮电大学共建语义卫星联合实验室 。 […]

发布时间:2025年10月23日
贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

快速阅读: 贝索斯提出在太空中建立数据中心的构想,利用不间断太阳能解决能源问题,但面临高昂的发射和维护成本及技术挑战。 贝索斯设想在地球大气层外利用持续阳光建立轨道数据中心。该计划承诺提供无限能源,不受云层和天气干扰的影响。然而,发射和维护 […]

发布时间:2025年10月11日
克瑞托斯庆祝Oriole火箭25年辉煌成就

克瑞托斯庆祝Oriole火箭25年辉煌成就

快速阅读: Kratos开发的Oriole火箭因2012年推出的TVC系统而性能大幅提升,完成多次高精度任务,支持全球多地点发射,助力高超音速研究,至今累计140次成功发射,确立行业领先地位。 Oriole的成功之旅因Kratos在2012 […]

发布时间:2025年10月11日
国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

快速阅读: 北京邮电大学研发的“卫星互联网防火墙”安全载荷成功发射,实现物理层与网络层协同防护,具备10Gbps高并发流量检测能力,为卫星互联网安全提供重要保障。 感谢IT之家网友 tellMe 的线索投递! IT之家 9 月 19 日消息 […]

发布时间:2025年9月19日
ICEYE推出战术级太空情报系统ISR Cell

ICEYE推出战术级太空情报系统ISR Cell

快速阅读: ICEYE推出ISR Cell集装箱系统,使国防组织能现场获取近乎实时的太空ISR数据,加速高风险环境决策。系统已验证,提供更快、更可靠的情报,覆盖各决策层。预计2026年初交付,扩展军事客户基础。 美国加利福尼亚州洛杉矶(SP […]

发布时间:2025年9月13日
深学环形塑形技术助力天文观测,深化宇宙理解

深学环形塑形技术助力天文观测,深化宇宙理解

快速阅读: 科研团队开发的深度环路整形技术,显著提升了LIGO引力波观测站的控制精度和稳定性,降低了噪声水平,有助于天文学家更准确地研究宇宙动力学和形成过程,开启了下一代引力波科学的大门。 我们新开发的深度环路整形技术改进了引力波观测站的控 […]

发布时间:2025年9月5日
月球探索新突破!AI 助力撞击坑研究,效率提升惊人

月球探索新突破!AI 助力撞击坑研究,效率提升惊人

快速阅读: 中国科学院地球化学研究所发布“月球科学多模态专业大模型V2.0”,大幅提升月球地质研究效率,未来将向全球开放“数字月球”云平台。 在全球科技迅速发展的今天,中国科学家正借助人工智能的力量,推动月球科学研究的新进展。近日,在202 […]

发布时间:2025年9月1日
我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

快速阅读: 中国将与阿联酋、约旦、埃及等国合作,共建气象卫星数据应用中心,研发灾害早期预警系统,开发气象人工智能模型,提升阿拉伯地区灾害性天气预报能力。 IT之家 8 月 29 日消息,据央视报道,我国将与阿联酋、约旦以及埃及等国家共同开展 […]

发布时间:2025年8月29日