给 AI 更多的“思考时间”如何落入过度思考的陷阱

发布时间:2025年2月20日    来源:szf
给 AI 更多的“思考时间”如何落入过度思考的陷阱

快速阅读: 据《福布斯》最新报道,增加处理时间和服务器资源虽可能提升AI表现,但也可能导致更多错误和资源浪费。这引发了一个问题:我们是否在追求短期利益而非长期解决方案?AI的真正进步需依赖于更好的设计和架构,而非仅仅依赖硬件升级。

增加更多的处理时间和服务器资源是否真的意味着人工智能在进步?还是我们只是在玩一个没有长期回报的短期游戏?

“我愿意等待。你可以花费任意所需的时间。”生成式AI回复:“我花了更多时间,意识到答案是100。我之前的回答错了。”你可以看到最新的回答明显是错误的。发生了什么?大概是一个AI幻觉现象。在处理过程中,AI组合了不应该组合的内容,或者添加或减去了不应该包括的东西。追踪AI幻觉的根源是具有挑战性的。一个有趣的研究问题是,在延长“思考时间”或测试时间计算时,是否会有更大的AI幻觉倾向。有些人直观地认为,是的,你是在掷骰子,因为增加的时间和允许更多的处理复杂性使得遇到这种情况的概率会增加。一种反驳是,由于AI是通过一系列步骤工作的,因此概率应该降低。由于逻辑路径正在进行中,AI幻觉应该被防止。

有关AI幻觉的更多信息研究,请参阅我的报道[链接]。关于思考时间的想法让我们对当前流行的信念进行高层次评估,即允许更多时间和更多处理是获得更好答案的灵丹妙药。有三大好处:

1. 更多的AI时间和AI处理可能是有帮助的。没有人会否认有时为AI提供更多的处理时间和资源将有助于提高答案。我们同意这几乎总是有希望的。
2. 可以开启自我一致性的抽样。在其他条件相同的情况下,AI有更高的机会通过给予更多时间和处理来生成多个答案,并能够选择最好的一个。对此表示赞同。
3. 对基于搜索的增强特别有益。如果提示包含需要多轮检查步骤的问题,例如我在国际象棋例子中的情况,这很可能在一定程度上是有益的,并且是一个受欢迎的机会去追求更深层次的“推理”或排列组合(数学和计算)。

以下是三个相反的缺点:

1. 资源成本和时间延迟:没有保证额外的时间和AI处理会取得成果。唯一已知的因素是时间会更长,延迟用户的响应,并且成本会上升。这些都是确定的。
2. 错误累积的可能性增加。似乎很有可能,额外的时间和处理给AI带来的机会让错误更容易进入问题中。尽管增加了测试时间计算以生成更好的答案,但得出的答案可能是错误的。
3. 边际效益开始递减。对于不需要大量资源的问题类别,存在着令人担忧的边际效益下降。物超所值的情况不存在。

关键要点和AI的未来

这一切归结为以下几点。有人认为我们只是在玩弄把戏,从而获得短期利益。AI制造商最简单的方法就是投入更多的服务器和处理时间,以便AI能得出更好的答案。但这是一种捷径。这不是指涉及的成本,而是相对于一开始就找到更好的方法来构建AI而言,这是一种捷径。

问题在于,一旦使用这种方式,这种“捷径”很快就会失效。生成式AI和LLM仍然受到相同的架构和设计约束。在测试时间消耗更多的计算资源巧妙地掩盖了内部仍然大致相同的工作方式。越来越多的人认为,我们正在回避真正的问题,即如何更好地构建和设计AI。硬件策略更像是孤注一掷。或许这给了AI制造商一些时间来探索更好的AI方法。或者他们可能会浪费这个时刻,最终陷入停滞。这是短期利益与长期利益之间的经典权衡。我们是否因为满足于短期收益而忽略了球,以至于在长期内我们会撞上一面墙?

声称我们可以通过不断增加算力来实现所谓的通用人工智能(AGI),可能是个误导。无论如何,现在就享受这些成果吧。即使AI制造商正在亏损,他们也迫切希望吸引和留住用户。头条新闻允许他们吹嘘用户数量以及用户有多高兴。投资者继续向这样的AI公司注入资金。

最后一点想法。英国著名哲学家托马斯·霍布斯曾说过:“随着计算的进行,定义的错误会成倍增加;这会导致人们陷入荒谬,最终他们看到了这一点却无法避免,除非重新从头开始计算。”也许这样的老生常谈在当今AI发展中仍有其道理。是的,确实如此。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日