山姆·奥特曼 (Sam Altman) 可以信任未来吗?
快速阅读: 据《纽约客》称,2017年,谷歌发明“变形器”后,OpenAI工程师拉德福德用其开发语言模型。OpenAI专注语言而非机器人,积累了大量训练数据,推出了GPT-2和ChatGPT。作者卡伦·郝在其书中探讨了OpenAI的竞争影响及行业趋势,指出其模式成为主流,但也带来巨大资源消耗和潜在风险。
2017年,谷歌的研究人员发明了一种名为“变形器”(Transformer)的新型神经网络后不久,一位名叫亚历克斯·拉德福德(Alex Radford)的年轻OpenAI工程师开始尝试使用它。与现有AI系统不同,变形器架构能够处理和关联更大规模的文本数据,而拉德福德决定在他的模型上训练一个包含七千本未出版英文书籍的数据库,其中包括浪漫、冒险、科幻故事等,涵盖了人类幻想和创造力的全貌。然后,他没有像谷歌的研究人员那样要求网络翻译文本,而是提示它预测句子中最可能的下一个单词。机器回应:一个词,接着另一个,再一个——每个新词都从那七千本书中埋藏的模式中推断出来。拉德福德并未提供语法规则或斯特伦克和怀特的语法书,他只是简单地喂给它故事。从中,机器似乎学会了如何自行写作。这感觉就像一场魔法表演:拉德福德按下开关,无中生有。他的实验为2022年发布的ChatGPT奠定了基础。
即便是在第一次震撼之后很久,文本生成依然会带来一种难以言喻的不安感。当你让ChatGPT讲笑话或写剧本时,它返回的内容——虽然很少完美,但总是可识别的——是一种对它所训练的巨大语料库的统计曲线拟合,每句话都带有该数据中编码的人类经验痕迹。在撰写电子邮件时,输入“嘿,非常感谢”,然后暂停,程序依次建议“抽出时间”、“花点时间”。我开始意识到哪些想法偏离了模式,哪些符合模式。我的邮件如今受到他人普遍想象的影响。其中许多人似乎都想感谢某人“抽出时间”。
拉德福德的突破并非偶然地发生在OpenAI。这家组织成立于2015年,作为早期以非营利性质运作的“人工智能曼哈顿计划”,并在山姆·阿尔特曼(Sam Altman)的领导下迅速成为公众关注的焦点。通过与微软合作,阿尔特曼获得了强大的计算资源使用权。然而,到2017年,实验室仍在寻求标志性成果。在同一时期,OpenAI的研究人员正在教一个T形虚拟机器人翻跟头:机器人会尝试随机动作,人类观察者会对哪些动作看起来像翻跟头进行投票。随着每次反馈循环,它都有所改进——尽管细微但可衡量。
公司也有独特的理念。其领导者谈论着人工通用智能的存在威胁——模糊定义的时刻,当机器超越人类智能时——并执着地追求这一目标。这种想法似乎是说,人工智能如此危险,因此必须比其他人更快地建立一个好的人工智能。即使微软的资源也不是无限的;用于一个项目的芯片和处理能力不能用于另一个项目。
在拉德福德突破之后,OpenAI的领导层——尤其是友善的阿尔特曼和他的联合创始人兼首席科学家伊利亚·苏茨克韦尔(Ilya Sutskever)——做出了一系列关键决策。他们将专注于语言模型而非翻跟头机器人。由于现有的神经网络已经能够从数据中提取模式,团队选择不专注于网络设计,而是尽可能多地积累训练数据。他们超越了拉德福德的未出版书籍库,进入了YouTube字幕和留言板聊天的泥潭——从互联网上广泛抓取语言。这种深度学习方法需要更多的计算能力,这意味着更多的资金,给最初的非营利模式带来了压力。但它奏效了。
GPT-2于2019年发布,在人工智能世界中是一个划时代的事件,随后是更面向消费者的ChatGPT于2022年发布,同样给公众留下了深刻印象。用户数量激增,同时也有一种神秘的动力感。在约塞米蒂附近的一个非正式会议上,苏茨克韦尔据说点燃了一个象征未对齐人工智能的稻草人;在另一次会议上,他带领同事高呼:“感受通用人工智能的力量。感受通用人工智能的力量。”
在卡伦·郝(Karen Hao)的《人工智能帝国:山姆·阿尔特曼的OpenAI的梦想与噩梦》(企鹅出版社)一书中,她追踪了OpenAI竞争对手——谷歌、Meta、Anthropic、百度——因GPT突破带来的后果,并认为每家公司都在某种程度上反映了阿尔特曼的选择。OpenAI的规模至上模式成为了行业的默认设置。郝的书既详尽又引人注目。
“正是OpenAI,凭借其亿万富豪背景、独特意识形态倾向以及阿尔特曼的独特动力、人脉和筹款才能,创造了使其特定愿景得以实现并占据主导的理想组合,”她写道。“OpenAI所做的每件事都不是必然的;其巨大的深度学习模型的爆炸性全球成本,以及在整个行业中引发的将其扩展到行星极限的危险竞赛,只能来自它实际所在的地方。换句话说,我们已经被迷住了——被存在风险的幽灵般、高尚的修辞所迷惑。”
在郝的叙述中,过去十年人工智能进化的真正故事并不是关于机器接管的具体日期或人类对技术控制的程度——这是通用人工智能辩论的核心议题。相反,这是一个关于企业的故事,关于我们如何得到了我们现在拥有的人工智能版本。
(以上内容均由Ai生成)