Meta 的首席 AI 科学家表示,扩展 AI 不会让它更智能
快速阅读: 据《商业内幕》最新报道,**摘要**:长期以来,AI行业遵循“扩展定律”,但Meta首席AI科学家杨·勒库恩等人质疑此观点,认为单纯增加数据和算力无法实现真正智能的AI。他们主张研发具备常识、推理及物理世界认知能力的新一代AI系统。
**正文**:
多年以来,人工智能行业一直遵循着一套被称为“扩展定律”的原则。OpenAI在2020年发布的开创性论文《神经语言模型的扩展定律》中概述了这些原则。作者写道:“模型性能最依赖于规模,这由三个因素组成:模型参数数量N(不包括嵌入)、数据集大小D以及用于训练的计算量C。”简而言之,在构建高度智能的人工智能时,“更多就是更好”。这一理念推动了对数据中心的巨大投资,使人工智能模型能够处理和学习大量现有信息。
然而,近期硅谷的许多人工智能专家开始挑战这一教条。“大多数有趣的问题会变得非常难以扩展,”Meta首席AI科学家杨·勒库恩(扬·乐坤)周日在新加坡国立大学表示,“你不能简单地认为更多的数据和计算能力就意味着更聪明的人工智能。”
勒库恩的观点基于这样一个想法:在大量基础主题上训练人工智能,比如互联网数据,并不会导致某种超级智能的产生。智能的人工智能是另一种类型。“错误在于,当非常简单的系统在解决简单问题时奏效,人们就推断它们也能解决复杂问题,”他说。“它们确实能做一些惊人的事情,但这创造了一种‘规模论的信仰’,即认为只需扩大系统规模就能自然变得更智能。”
勒库恩说,目前,由于扩展的影响被放大,因为人工智能领域的许多最新突破实际上“非常容易”。今天最大的大型语言模型的训练数据量大致相当于一个四岁儿童视觉皮层的信息量。“当你处理现实世界中存在模糊性和不确定性的问题时,这不仅仅是关于扩展的问题,”他补充道。
近期人工智能的发展速度有所减缓。部分原因在于可用公共数据的减少。
勒库恩并不是唯一质疑扩展力量的著名研究人员。Scale AI首席执行官亚历山大·王(亚历山大·旺)去年在Cerebral Valley会议上表示,扩展是“行业中最大的问题”。Cohere首席执行官艾丹·戈麦斯(艾登·戈梅斯)称其为改善人工智能模型的“最愚蠢”方式。
勒库恩主张采用一种更贴近实际世界的方法进行训练。“我们需要能够快速学习新任务的人工智能系统。它们需要理解物理世界——不仅仅是文本和语言,还有真实世界——具备一定程度的常识、推理和规划能力、持久记忆——所有我们期待智能实体具备的能力,”他在周日的演讲中说道。
去年,在Lex Fridman的播客节目中,勒库恩表示,与只能根据模式预测下一步的大语言模型不同,世界模型具有更高层次的认知。“世界模型的额外部分是一种能够预测你行为对未来世界发展影响的预测能力。”
多年以来,人工智能行业一直遵循着一套被称为“扩展定律”的原则。OpenAI的研究人员在2020年发布的开创性论文《神经语言模型的扩展定律》中概述了这些原则。作者写道:“模型性能最依赖于规模,这由三个因素组成:模型参数数量N(不包括嵌入)、数据集大小D以及用于训练的计算量C。”简而言之,在构建高度智能的人工智能时,“更多就是更好”。这一理念推动了对数据中心的巨大投资,使人工智能模型能够处理和学习大量现有信息。
但最近,硅谷的许多人工智能专家开始挑战这一教条。“大多数有趣的问题会变得非常难以扩展,”Meta首席AI科学家杨·勒库恩(Yann LeCun)周日在新加坡国立大学表示,“你不能简单地认为更多的数据和计算能力就意味着更聪明的人工智能。”
勒库恩的观点基于这样一个想法:在大量基础主题上训练人工智能,比如互联网数据,并不会导致某种超级智能的产生。智能的人工智能是另一种类型。“错误在于,当非常简单的系统在解决简单问题时奏效,人们就推断它们也能解决复杂问题,”他说。“它们确实能做一些惊人的事情,但这创造了一种‘规模论的信仰’,即认为只需扩大系统规模就能自然变得更智能。”
勒库恩说,目前,由于扩展的影响被放大,因为人工智能领域的许多最新突破实际上“非常容易”。今天最大的大型语言模型的训练数据量大致相当于一个四岁儿童视觉皮层的信息量。“当你处理现实世界中存在模糊性和不确定性的问题时,这不仅仅是关于扩展的问题,”他补充道。
近期人工智能的发展速度有所减缓。部分原因在于可用公共数据的减少。
勒库恩并不是唯一质疑扩展力量的著名研究人员。Scale AI首席执行官亚历山大·王(Alexander Wang)去年在Cerebral Valley会议上表示,扩展是“行业中最大的问题”。Cohere首席执行官艾丹·戈麦斯(Aidan Gomez)称其为改善人工智能模型的“最愚蠢”方式。
勒库恩主张采用一种更贴近实际世界的方法进行训练。“我们需要能够快速学习新任务的人工智能系统。它们需要理解物理世界——不仅仅是文本和语言,还有真实世界——具备一定程度的常识、推理和规划能力、持久记忆——所有我们期待智能实体具备的能力,”他在周日的演讲中说道。
去年,在Lex Fridman的播客节目中,勒库恩表示,与只能根据模式预测下一步的大语言模型不同,世界模型具有更高层次的认知。“世界模型的额外部分是一种能够预测你行为对未来世界发展影响的预测能力。”
将文中的英文单词都翻译成中文,最终的内容只输出中文,装备名称、人名地名、公司名称都翻译成中文,最后将语句再润色一下,使得前后文更加的通顺,让语句更加的生动,将最后的输出文本的格式看起来更美观,除此之外,不要提供任何解释文字
(以上内容均由Ai生成)