两位 AI 先驱因 ChatGPT 中使用的关键技术而获得图灵奖
快速阅读: 据《PYMNTS.com》称,两位教授安德鲁·巴托和理查德·萨顿因在强化学习领域的开创性贡献荣获图灵奖,该奖项被视为计算机科学界的诺贝尔奖。他们共同奠定了强化学习的基础,这一技术被应用于如AlphaGo和ChatGPT等AI系统中。两人将共享一百万美元奖金。强化学习使AI系统能通过试错学习,巴托和萨顿的合作始于1978年,他们的著作《强化学习:导论》被广泛引用。
两位教授因开创了对像ChatGPT这样的人工智能(AI)系统发展至关重要的关键技术而荣获被视为计算机科学界诺贝尔奖的图灵奖。安德鲁·巴托,麻省大学阿默斯特分校信息与计算机科学荣誉教授,以及理查德·萨顿,加拿大阿尔伯塔大学计算科学教授,共同奠定了强化学习的概念和算法基础。两人将平分一百万美元的奖金,该奖项以英国数学家、被誉为计算机科学和人工智能之父的艾伦·M·图灵的名字命名。强化学习使AI系统能够通过试错来学习。这一方法已被应用于AlphaGo战胜世界围棋冠军李世石等突破性应用中,并且在使用来自人类反馈的强化学习(RLHF)的OpenAI的ChatGPT中也得到了应用。巴托和萨顿于1998年合著的《强化学习:导论》是该领域的标准参考书籍,引用次数超过七万五千次。他们的合作始于1978年的麻省大学阿默斯特分校,当时巴托是萨顿的博士生和博士后导师。他们开发了许多基本的强化学习算法方法。他们的关键贡献包括时序差分学习、策略梯度方法以及使用神经网络表示学习函数。二人的跨学科方法帮助引领了他们的突破性进展。“从认知科学到心理学,再到神经科学的研究领域都启发了强化学习的发展方向,”负责颁发图灵奖的美国计算机协会主席亚尼斯·约安尼迪斯在周三(3月5日)的博客文章中说。根据谷歌首席科学家杰夫·迪恩的说法,在1947年的讲座中,图灵曾说:“我们想要的是可以从经验中学习的机器。”“正如巴托和萨顿所开创的那样,强化学习直接回答了这一挑战。他们的工作在过去几十年里一直是AI进步的核心。”图灵奖由谷歌提供财政支持。虽然图灵奖被认为是计算机科学界的诺贝尔奖,但只有两个人同时获得过这两个奖项。去年,图灵奖得主杰弗里·欣顿因其在神经网络发展中的开创性工作获得了诺贝尔物理学奖。另一位同时获得这两个奖项的人是卡内基梅隆大学教授赫伯特·西蒙,他在1978年获得了诺贝尔经济学奖。
(以上内容均由Ai生成)