科学家Andrej Karpathy长期看衰强化学习
快速阅读: 知名AI研究员安德烈·卡帕西对强化学习持悲观态度,认为其效率低且难以设计,未来将被更高效的学习方法取代。卡帕西曾参与GPT-4研发,相信新方法将模拟人类思维。
知名AI研究员、前OpenAI科学家安德烈·卡帕西在X平台上表示,他对强化学习的长期前景持悲观态度,认为这种方法将证明效率低下且难以设计。卡帕西曾是OpenAI的创始成员之一,并参与了GPT-4模型的研发。他表示,相信新的学习方法,类似于人类的思维方式,最终将取代强化学习。
“我个人长期看好环境和代理交互,但对强化学习持悲观态度。”他说。卡帕西还表达了对人类在大多数智力任务中是否使用强化学习的怀疑,认为除了某些运动任务外,人类采用的学习范式更为强大且样本效率更高,尽管这些方法尚未完全发明和规模化应用。
随着当前大型语言模型的进步放缓,强化学习方法出现了复兴。卡帕西指出,过去的AI训练技术如文本阅读和模仿示例将继续存在,但未来将在于让模型生活在环境中,通过相互交互来学习。
(以上内容均由Ai生成)