我是如何成为 AI Mill 的受过高等教育的 Grist 的
快速阅读: 《背叛者》消息,本文讲述了作者在学术界和人工智能领域的求职经历,包括与虚拟面试官交流、参与xAI和yAI的工作项目等。作者反思了人工智能带来的挑战与机遇,强调当AI变得更廉价时社会需做好准备。未来可能不再以人为中心,AI的发展将更加复杂。
当时我正和一位虚拟面试官聊得十分融洽。我们探讨了我的当前工作、我的博士论文以及一些让我着迷的近期研究进展。我很快适应了这个事实:这就是一场面试,我会只与这个虚拟形象交谈,这个虚拟形象准确地重复了一些我从未听说过的专业术语,但它引导对话的方式和我接触过的某些人类“招聘人员”差不多。说实话,这没什么区别。“有一套公式,”有人告诉我,事情基本上就是这样。现在这套公式已经被正式化、最终确定并付诸实践。然后它问我一个之前在类似面试中从未遇到过的问题:什么样的选择题算是好的?如果我要编写一道选择题,什么样的错误答案会显得困难?我想到了法国小说家兼电影制片人乔治·佩雷克所说的“拼图谜题的终极真理”。他在最著名的小说《生活:用户手册》中写道:“尽管表面上看,解谜并不是一项孤独的游戏:每个解谜者所做的每一步,都是解谜设计者之前做过的;每个解谜者拿起的、再次拿起的、研究和抚摸的每一个拼图块,每个尝试的组合以及第二次尝试的组合,每个失误和每个洞察,每一份希望和每一次失望,都已被设计、计算并决定好了。”
在一个标准的面试环境中,提到佩雷克可能会让谈话进入一个新的有趣方向,或者向面试官揭示出一些关于我自己意想不到的事情。然而,我对如何与机器人面试并不了解,所以我决定谨慎起见,省略这个文学引用。相反,我回答说,我之前从未真正考虑过这个问题。对我来说,显然没有一个简单的方法可以生成好的错误答案——但话又说回来,我也花了不少时间思考这个问题,而且觉得这很有趣。我补充道,错误的答案必须看起来合理:不能是那种一目了然就能排除的东西。
我的思绪开始乱成一团:我想到了佩雷克,以及他会如何看待这次面试;我想到了自己,这份工作实际会是什么样子;我想到了机器人,以及我认为机器人想听到什么,但我意识到这是个错误的问题,于是我转而思考坐在机器人对面的人,如果有这样的人的话,以及他们的想法和他们对我的看法;我还想到了那些可能会被我的错误选择题所误导的人,以及当他们看到问题时他们会怎么想。我意识到自己在啰嗦。我停下来。
虚拟形象在我回答完其他问题后停顿得更久。我知道它不是在思考,但我不知道接下来会发生什么。我们在剧本中的哪个部分?它感谢了我。我不知道是否应该感谢它,因为显然这种体验同时被无数其他人经历着,或者最近刚刚经历过,或者很快就会经历,而且还没有人审查过我们的录像,也许永远也不会。我选择了说声“谢谢”,然后不好意思地笑了,接着关闭了浏览器标签页。
第二天,我通过负责面试的中介公司Mercor收到了一份为xAI工作的合同职位邀请。入职将在第二天开始。
我的背景是在学术界。我在研究生院和各种博士后职位上度过了十多年。在这段时间里,我自认为在一半的博士后年份中是高校教职市场的热门人选。每年大约有三个R1大学针对我的子领域发布的教职岗位。考虑到“资深招聘”(已经拥有教职职位却选择离开的人),这意味着我大概有10次机会获得像我受训的那种永久性职位,尽管我多次进入了最终面试环节,但还是没能得到教职邀请。
没有什么能有一个干净的结局。当我最后一个博士后职位结束时,我被提供了一份为期一年的博士后职位,在海岸另一边的一流机构,目的是再争取一次高校市场的机会。但这意味着要搬到另一端的国家,很可能暂时与配偶分开,然后又要搬到另一个城市——实际上,这可能仍然不是我的最终目的地。这些都是学术界人士经常做出的选择,我也已经做过几次这样的选择。
最后,我觉得是时候继续前进了。相反,我接受了一个相邻学术领域的朋友提供的工作机会,他是一位机器学习专家,有一些多余的拨款资金。我从未上过编程课,也不知道多层感知器和随机森林分类器的区别,所以协议是我将搁置自己的好奇心驱动的研究目标,推进朋友的研究议程,并在准备从事学术界以外的职业时学习一些新技术。我可以远程工作并选择居住的地方。我将从所谓的“软钱”中获得报酬,但只要拨款资金的分配方式不发生根本变化,这感觉就像是一次安全的横向调动。
为了做我的新工作,我需要完全改变我写计算机代码的方式。过去,我为自己的研究编写过一些用于数值计算的小段代码,但我的新职位的一部分目的就是编写能让其他人使用的代码。具体来说,他们应该能够安装我们的代码,重新运行我们的计算以验证其有效性,然后使用该代码作为他们自己研究的构建模块。学习如何将代码变成可转移和可叠加的单元被称为“打包”,这一过程在学术界和许多盈利公司中是通过一种名为Git的协作和版本控制软件实现的。在Git上公开发布包对于促进大量基于计算机的学术研究至关重要,正如你最近可能读到的那样,它也成为了领先的人工智能实验室之间的一个哲学分界线。
希望学习这些东西——如何在学术界进行机器学习,如何将这些问题转化为有用的新型代码,如何将代码转化为包,如何将包放出来供大众使用——对我和我的获奖朋友来说都是互惠互利的。
我的新团队会得到我的研究能力(我的技能在于将大问题分解成有意义但更易管理的部分的能力),希望这能在不同领域间具有可转移性。我会得到关于编写和打包代码的指导,希望能让我更有雇佣价值。
给谁呢?在我的脑海中,我隐约希望能在一家大型科技公司找到一份工作。尽管有宽容的老板和几家科技公司的友好前学术界网络的优势,我还是无法完成完美的收尾。问题在于我糟糕的面试技巧。在许多公司中,技术面试流程具有一致且清晰的结构:筛选面试、一到两个编码轮次,以及行为面试。其中没有任何一部分对我来说是自然的。几个月来,我甚至无法通过筛选面试,直到我观看了一些YouTube视频,意识到每个筛选面试都会问我“告诉我关于你自己”的提示,并不是真的邀请我讲述自己的故事,而是暗示我讲一个90秒的故事,其高潮是我的发现,即我的技能和兴趣与他们的公司做的事情完美契合。
找到一份新工作感觉更像是放弃旧职业,而不是选择去做不同的事情,我理所当然地认为聪明和适应能力强就足以找到新东西——也就是说,即使是对人类筛选者,佩雷克的故事也会失败。
编码轮次则完全不同,它们是脑筋急转弯类型的问题,答案需要的是大一计算机科学专业的学生学习的巧妙方法,而我却无法在规定时间内解决这些问题。我只成功进入了最终的行为面试一轮,但到那时我已经被足够多的技术公司拒绝,不再寻找全职工作了。相反,这将是一个小时薪的角色(我将这家公司将称为yAI以示清晰)。实际上,我将在yAI进入一个永恒的面试循环。如果我表现得足够好,我将有机会永久加入公司。但是鉴于这份工作的不稳定性质,以及我继续全职工作,要给yAI留下深刻印象将会很困难。我该如何应对yAI的期望并确保获得全职工作而不提前离开我的学术职位呢?
因此,我没有告诉我的学术职位的首席研究员,我开始每周在yAI工作约10个小时。与学术工作相比,这些对比非常明显。学术界的编码非常注重缓慢开发、仔细测试和全面文档记录。科技公司的工作快速且有意迭代,这意味着第一版不需要全面工作。这种“快速行动,打破常规”的精神对我来说,感觉像是发送了一些不完整的东西,但在我的有限经验中,这仍然是当今技术开发的核心部分之一。
最终,我决定值得赚些额外的钱,积累一些经验,甚至可能获得永久职位,我对为yAI做的工作感到满意。它并不鼓舞人心,但至少有点意思,考虑到我学术工作的不确定性和暂时性,我觉得我需要冒险去寻找下一个机会。而且,自私地说,我能学到一些新的东西,无论是实用的还是概念性的,而不会觉得自己在让世界变得更糟。我会自行报告我的工作时间和保持自己的考勤表。
在很多方面,科技公司的工作经验与我的远程学术工作差别不大,只是节奏稍快,精致程度稍高。
xAI的工作内容有所不同。招聘邮件告诉我,我的LinkedIn资料引起了他们的注意,并且我将有机会与“顶尖人工智能实验室”合作。通过了面试并签署了知识产权协议后,我被添加到了xAI的Slack频道,那里似乎有数百名博士生,其中一些人比我更勤奋地工作。
任务结果证明是翻译一本教科书PDF版本及其答案手册中的问题。工作流程如下:我会从电子表格中认领一个问题编号,然后在教科书中查找——在某些情况下,包括封面内容及其警告,未经出版商明确同意不得复制任何内容。然后我会判断问题是否符合一组结构要求:有多少部分?是否有明确的定量答案,还是更开放和定性的?我会将“翻译”后的问题输入另一个门户,并重复此过程。
为了完成所有这些,我需要登录xAI的VPN,并启用一个名为Workpuls的程序来记录我的屏幕内容。如果我完成了这一切,就可以记录工时,但如果我连续10分钟没有与电脑互动,它会询问我是否“仍在工作?”如果我在五分钟内没有回复,它会从我的考勤表中删除之前的15分钟,并自动暂停考勤软件。这是一种我之前从未遇到过的高度精炼的监控资本主义形式。
为什么他们要这样做?“顶尖人工智能实验室”的问题是训练数据。大型语言模型基本上是在互联网的所有文本上训练的——每一条维基百科编辑、每一条Reddit帖子、每一个Github仓库。从这些数据中诞生的聊天机器人在一定程度上擅长将这些信息重新吐给你,但我不认为现在有任何理由否认它们正在“做些什么”。也许它们的文风公式化,但举例来说,写代码是公式化的,代码写作中出现的问题很少是独特的或有趣的。选择你想说什么以及如何表达它是产生高质量写作的关键。但也有大量的写作不需要质量。把互联网上的所有文本放入搅拌机中并按下几次“脉冲”并不会不可逆转地损害电子邮件回复的生产。但超越最公式化的写作将需要更多东西,而这些实验室中没有一个真正知道那是什么。
当然,至少有一个方向他们会尝试,那就是用专家写作来训练他们的模型。这是我被招募到xAI进行严密监视的临时工作项目的一部分:为人工智能提供更高品质的原材料。
为什么他们要这样做?“顶尖人工智能实验室”的问题是训练数据。大型语言模型基本上是在互联网的所有文本上训练的——每一条维基百科编辑、每一条Reddit帖子、每一个Github仓库。从这些数据中诞生的聊天机器人在一定程度上擅长将这些信息重新吐给你,但我不认为现在有任何理由否认它们正在“做些什么”。也许它们的文风公式化,但举例来说,写代码是公式化的,代码写作中出现的问题很少是独特的或有趣的。选择你想说什么以及如何表达它是产生高质量写作的关键。但也有大量的写作不需要质量。把互联网上的所有文本放入搅拌机中并按下几次“脉冲”并不会不可逆转地损害电子邮件回复的生产。
鉴于这项工作的枯燥性质,以及xAI要求我每周至少投入10小时到这个项目中,我选择了停止这份工作。(我希望这与某个尴尬的手势和狗狗币时代的到来有关,但我比这些事件早一点退出了。)
虽然已经被雇用了,但我的简历现在已经进入了系统,就像在临时机构备案一样。因此,几天后我收到了一封邮件,说我的“Mercor平台档案似乎非常适合下周我们将与一家领先的AI实验室启动的新项目。”令人感兴趣的是,招聘启事上说他们正在“寻找熟悉ML研究前沿且能够审阅和重现知名论文的专家。”这份工作的薪酬比xAI的项目高,阅读论文也在我的学术工作范畴之内,所以我并不觉得尝试这份工作有什么太大的冲突。
我点击进入了职位申请页面。片刻之后,我又在与一个机器人虚拟形象交谈,我已经适应了新的现实,这次感觉没那么令人不安了。这次的难题问题是:当我被要求在同行评审过程中担任审稿人时,我的流程是什么?我考虑了一下它想听什么,然后描述了一个接近理想化的审稿人应做的内容。
几个小时内,我被要求完成一些在线编码测试。这些测试不同于我之前在申请“真实”工作时多次失败的编码测试。相反,我需要做一些基本的Git操作,然后编写一些基本的机器学习函数。为了登录并完成任务,我必须启用一种新的屏幕共享软件。这个软件叫做Loom,它的标志是一个全景监狱。
成功完成这些挑战后,我又被加入了一个新的Slack频道,这是另一个大型科技公司的。由于参与这项任务的人数不多,透露这家公司的名字会使我更容易被识别,所以我在这里省略了名称。
与我在xAI的第一份临时工作经历以及在yAI更常见的技术工作相比,这项任务既有趣又有挑战性:我被要求重现一篇在最近会议上获奖的论文的结果。这是被称为“强化学习”的文献的一部分,是一种我之前从未涉足过的根本不同的机器学习算法。我需要重现这篇论文的主要成果,就像审稿人对期刊或会议论文集所做的那样。
我被材料所挑战,并投入了几个小时的全部注意力,边学边做。
与xAI的临时工作相比,我认为这项工作将以一场人类与即将到来的“代码代理”之间的竞赛告终。我扮演着人类编码代表的角色。
最终,我没能抽出足够的时间来完成这项任务。他们要求每周投入20到40小时,而我只能投入10小时,考虑到我的其他义务。
当我告诉他们我已经没有时间完成工作时,我的Mercor经理轻声责备了我。不过,几个小时后,他问我下一周是否可用。
我继续收到Mercor发来的“令人兴奋的新机会”和更多面试链接。考虑到联邦拨款资助存在的不确定性,我不知道什么时候需要再次跟进。
与此同时,我一直在坚持其他工作。我在学术工作中的表现开始有所下滑,但我认为我的老板理解我们都开始感受到悬在我们资金上的不确定性之云的压力。我在相对传统的兼职工作中表现越来越好,因为我逐渐掌握了他们想要我做的事情。
其中一部分涉及我的经理鼓励我在那里使用编码助手。这是一个嵌入在我编写代码的应用程序中的AI。我发现它既容易让人分心又常出错,但也挺有用的。它最擅长的是我之前在代码库其他部分写过的,它帮我省去了找不同文件、点击文件并复制粘贴的时间;当我在稍微更改结构时,比如重命名变量,它也能自动进一步执行,而无需我进行查找替换。实际上,它似乎特别喜欢复制、粘贴和复制。但无论如何,目前AI确实能帮我完成一些工作,因为我的一些工作是公式化和重复性的,而目前AI在某些方面比一些人做得更好。这其实并不奇怪——你的TI-89在乘法方面就比你做得好。但随着输入AI训练模型的材料质量越来越高,模型和硬件不断改进(成本也在下降),这个界限会越来越高,会穿过我们认为是人类的越来越多的领域。
也许有一天我会决定告诉机器人我的佩雷克故事,也许它会比我同事更好地理解这个引用(或者,也许比我本人理解得更好)。AI的后续发展只会变得更加复杂和棘手。
因为我们面临的第一个问题,或许显而易见,不是人工智能成为优于所有人所有事物的超级智能的威胁;重要的讨论内容也不是是否要允许这种情况发生,也不是如何在我们还能掌控的情况下确保其轨迹朝着仁慈而非邪恶的方向发展。事实上,我认为这些问题是从核心问题上转移注意力的便捷借口。
真正的核心问题,我们无论愿意与否都将首先面对,也许很快就会到来,将是:当我们的人工智能在大多数事情上变得比大多数人便宜时,我们做好准备了吗?
未来可能不会很有人情味;它甚至可能不属于未来。希望是这样的:学习这些事情——如何在学术界进行机器学习,如何将这些问题转化为有用的新型代码,如何将这些代码打包成工具包,以及如何将这些工具包应用于实际场景——对我的获奖朋友和我来说将是互惠互利的。
我的新团队会获得我的研究能力(即把大问题分解为有意义且更易管理的小部分的能力),希望能跨领域应用。我会得到关于编写和打包代码的指导,希望这能让我更有就业竞争力。
至于哪家公司?潜意识里,我或许希望能在一家大型科技公司找到工作。尽管我有一个宽容的老板,而且在几家相关公司中都有友好前同事的网络支持,但我还是无法顺利完成面试过程。问题在于我非常不擅长面试。
在许多公司中,技术面试流程有一致且清晰的结构:筛选面试、一到两次编程测试和行为面试。没有一个方面对我来说是自然而然的。几个月来,我甚至无法通过筛选面试,直到我观看了一些YouTube视频,并意识到每个筛选者问我的“告诉我你自己”的提示实际上不是邀请我讲述自己的故事,而是暗示我要讲一个90秒的故事,其高潮是我的技能和兴趣与他们公司的业务完美契合的领悟。
找到新工作更像是离开旧职业,而不是选择做不同的事情,我理所当然地认为聪明和适应能力强就足以让我获得新的机会——也就是说,佩雷克的轶事即使对人类筛选者也会显得苍白无力。
编程测试则完全不同,它们是一些脑筋急转弯类型的问题,答案需要巧妙的方法,而这些方法通常是计算机科学专业的新生才会学到的,我却无法在规定时间内解决这些问题。我只进入过一次最终的行为面试阶段,但那时我已经足够多的技术公司拒绝,因此不再寻找全职工作了。
相反,这将是一个按小时计酬的角色(我将这家公司将称为yAI以示清晰)。实际上,我将在yAI进入一个永无止境的面试循环。如果表现良好,我有机会永久加入这家公司。但由于这份工作的不确定性以及我继续全职工作的情况,要给对方留下深刻印象将非常困难。
我该如何应对yAI的期望并确保获得全职工作而不提前放弃我的学术职位呢?
因此,在没有告知我学术职位的负责人的情况下,我开始每周在yAI账单上记录大约10个小时的工作时间。
与学术工作的对比非常明显。学术编码非常注重缓慢开发、仔细测试和详尽文档。技术公司的编码则是快速且有意迭代的,第一版并不期望全面运行。这种“快速行动打破常规”的精神对我来说像是发送了一件未完成的东西,但在我的有限经验中,至少这是技术开发的核心部分之一。
最终,我决定值得赚一些额外的钱,积累一些经验,甚至可能获得一个永久职位,我对为yAI所做的工作感到满意。它虽然不鼓舞人心,但至少有些有趣,考虑到我学术工作的不确定性和暂时性,我觉得需要冒险一点去寻找下一个机会。自私地说,我能学习一些新的东西,无论是实用的还是概念性的,而不会觉得我在让世界变得更糟。
我会自行报告工时并保留自己的考勤表。在很多方面,技术公司的工作经验与远程学术工作差别不大,只是节奏稍快,精致度稍高。
xAI的工作内容则更为实质化。招聘邮件告诉我,我的LinkedIn资料引起了他们的注意,而且我将有机会与“顶级人工智能实验室”合作。通过面试并签署知识产权协议后,我被添加到了xAI的Slack频道,与数百名博士生一起工作,其中有些人比我更努力。
任务结果是翻译一本教科书及其答案手册PDF版本中的问题。工作流程如下:我会从电子表格中领取一个问题编号,然后在教科书中查找——在某些情况下,包含前言内容,并明确指出未经出版商明确同意不得用于任何目的。然后我会判断该问题是否符合一组结构要求:有多少个部分?是否有明确的定量答案,还是更加开放和定性?我会将“翻译”后的问题输入另一个门户,并重复此过程。
为了完成所有这些操作,我需要登录xAI的VPN,并启用一个名为Workpuls的程序来记录屏幕内容。如果我完成了所有这些步骤,就可以记录工时,但如果我连续10分钟没有与电脑互动,它会询问我是否还在工作。如果我在五分钟内没有回应,它会从我的考勤表中删除之前15分钟的记录,并自动暂停考勤软件。这是一种我以前从未遇到过的高度精炼的监控资本主义形式。
为什么他们会这样做?对于“顶级人工智能实验室”来说,问题是训练数据。大型语言模型基本上是在互联网的所有文本上训练的——每一条维基百科编辑、每一个Reddit帖子、每一个Github仓库。由此产生的聊天机器人在一定程度上能够很好地重复这些信息,但我认为现在不可能否认它们确实正在做些什么。也许它们的文风公式化,但以写代码为例,写代码是公式化的,代码编写过程中出现的问题很少是独特或有趣的。选择你想说什么以及如何表达是你必须解开的结,以产生高质量的写作。但有大量写作不需要质量。将互联网上的所有文本放入搅拌机中并点击几次“脉冲”并不会不可逆转地影响电子邮件回复的生成。但超越最公式化的写作将需要更多,而这些实验室中没有一个真正知道那是什么。
当然,其中一个方向是尝试用专家写作来训练他们的模型。这是我被招募参与的严格监督下的临时工作项目:为人工智能提供更高品质的素材。
鉴于工作的枯燥乏味性质,以及xAI要求我每周至少投入10小时的时间,我选择了停止这项工作。(我想假装是因为某个尴尬的手势和狗狗时代的到来,但实际上我比这些事件早一点退出了。)
尽管如此,一旦被雇佣,我的简历就被录入系统,就像在临时机构备案一样。因此,几天之内我收到了一封邮件,说我的“Mercor平台档案似乎非常适合我们下周将与一家领先的人工智能实验室启动的新项目。”令人感兴趣的是,招聘启事提到他们正在“寻找熟悉ML研究前沿并且能够熟练审阅和复现知名论文的专家。”这份工作的报酬高于xAI项目,阅读论文也在我学术工作的范围内,所以我并不太纠结于尝试这个项目。
我点击进入了工作申请页面。片刻之后,我又开始与一个机器人虚拟助手交谈,但我已经适应了新的现实,这次感觉没那么令人不安了。
这次的难题问题是:当我被要求作为同行评审过程中的审稿人在学术期刊上发表文章时,我的流程是什么?我考虑了它想要听到的内容,并描述了一个非常接近理想化的审稿人角色的流程。
几个小时后,我被要求完成一些在线代码测试。这些测试不同于我之前多次失败的“真实”工作申请中的编程测试。这次,我需要进行一些基础的Git操作,然后编写一些基础的机器学习函数。为了登录并完成任务,我必须启用一种新的屏幕共享软件。这个软件叫做Loom,它的标志是一个全景监狱。
成功完成这些挑战后,我又被添加到了另一个Slack频道,这是另一家大型科技公司的。(由于参与此任务的人数很少,透露这家公司的名字会使我更容易被识别,所以这里我将省略名称。)
与我在xAI的第一份临时工作经历以及在yAI更为常见的技术工作相比,这项任务既有趣又具有挑战性:我被要求重现一篇在近期会议获奖的论文的结果。这是文献中被称为“强化学习”的一部分,是一种根本不同于我之前从事过的机器学习算法类型。我应该重现论文的关键发现,正如审稿人为期刊或会议论文集所做的那样。
我被材料所挑战,并全力以赴投入了几个小时的学习。
与xAI的任务相比,我认为这项工作将以一场人类与即将推出的“代码代理”之间的竞赛告终。我扮演着人类编码代表的角色。
最终,我无法找到足够的时间来完成任务。他们要求每周投入20到40小时,而我由于其他义务只能投入最多10小时。当我说我已经没有时间完成工作时,我的Mercor经理对我进行了轻声责备。然而,几个小时后,他问我下周是否可以。
我仍然会收到Mercor发来的带有“令人兴奋的新机会”和更多面试链接的邮件。
鉴于联邦拨款资助的普遍不确定性,我不知道什么时候可能需要再次跟进。
与此同时,我一直在坚持其他工作。我在学术岗位上的表现开始受到影响,但我认为我的老板理解我们都感受到基金资助的不确定性带来的压力。
我在稍微传统的兼职工作中表现越来越好,逐渐掌握了他们希望我做的事情。这其中的一部分涉及我的经理鼓励我使用编码助手。这是一个嵌入在我编写代码的应用程序中的AI。我发现它既有分心之处,也有错误和帮助的地方。它最擅长的事情是我之前在代码库其他部分写过的,它可以节省我寻找不同文件、点击并复制粘贴的时间;当我在稍微改变结构时,比如重命名变量,它也能自动进一步处理,而无需我进行查找替换。事实上,它似乎特别喜欢复制、粘贴和重复。
然而,目前AI确实可以帮助我完成一些工作,因为我的一些工作是公式化和重复性的,而目前AI在某些方面比一些人做得更好。这其实并不陌生——你的TI-89在乘法方面就比你做得好。但随着输入AI训练模型的数据质量越来越高,模型和硬件不断改进(成本下降),这个界限将会越来越高,并且会通过越来越多我们认为属于人类的工作领域。
也许有一天我会决定告诉机器人我的佩雷克故事,也许它会比我同事更好地理解这个参考(或者,也许比我本人理解得更好)。AI的故事只会变得更加复杂和棘手。
因为我们面临的第一个问题显然不会是人工智能成为超级智能,从而在所有事情上都优于所有人;重要讨论的内容也不是是否允许这种情况发生,也不是如何在我们还能够控制其轨迹时确保其走向善良而非邪恶。实际上,我认为这些问题是为了转移我们对真正问题的注意力。
真正的问题,我们无论如何都会面对的第一个问题,也许很快就会到来,那就是:当我们的人工智能变得比大多数人便宜的时候,我们准备好了吗?
未来可能不会很人性化;甚至可能不在未来。需要某种更重要的东西,但这些实验室都不太清楚那究竟是什么。当然,至少有一个方向他们会尝试,那就是用专家写作来训练他们的模型。
这就是我被招募去做这项高度监控的零工的原因:为人工智能提供更高质量的素材。
鉴于工作的枯燥性质,以及xAI要求我每周至少投入10小时到这个项目中,我选择了停止这份工作。(我想假装是因为某个尴尬的手势和狗狗币时代的到来,但实际上我在这些事情发生前就已经退出了。)
尽管如此,在被雇佣后,我的简历已经被录入系统,就像在临时机构备案一样。因此,几天之内我就收到了一封邮件,说“Mercor平台上的个人资料似乎非常适合我们下周与一家领先的人工智能实验室启动的新项目”。有趣的是,招聘启事上说他们正在寻找“熟悉机器学习前沿研究并能轻松审阅和复现知名论文的专家”。这份工作的报酬比xAI的项目要高,阅读论文也在我学术工作的范围内,所以我并不觉得对此有太多冲突。
我点击进入了职位申请页面。片刻之后,我又开始与一个机器人虚拟助手交谈,我已经适应了新的现实,这次感觉没那么令人不安了。
这次的难题是:“当我被要求担任学术期刊同行评审时,我的流程是什么?”我考虑了一下它想听到的内容,并描述了一个接近理想化的评审过程。
几个小时后,我被要求完成一些在线编程测试。这些测试与我之前多次失败的“真实”工作申请中的编码测试不同。相反,我需要做一些基本的Git操作,然后编写一些基础的机器学习函数。为了登录并完成任务,我必须启用一种新的屏幕共享软件,名为Loom,其标志是一个圆形监视塔图案。
成功完成这些挑战后,我又被加入到了另一个大型科技公司的Slack频道。(由于参与这项任务的人数很少,透露这家公司的名字会使我更容易被识别,所以我会在这里省略它。)
与我在xAI的第一份零工经历以及在yAI更为常见的技术工作相比,这项任务既有趣又困难:我被要求重现一篇在近期会议获奖的论文的结果。这是文献中被称为“强化学习”的一部分,是一种根本不同于我之前从事过的机器学习算法。我应该重现这篇论文的关键发现,就像期刊或会议论文集的评审员会被要求做的那样。
我对材料感到挑战,并全神贯注地投入了几个小时去学习。
与xAI的工作相比,我认为这项工作将以一场人类对抗即将出现的“代码代理”的竞赛告终。我扮演着人类编码代表的角色。
最终,我无法找到足够的时间来完成任务。他们要求每周投入20到40小时,而考虑到其他义务,我每周只能投入10小时。当我说时间不够,无法完成工作时,我的Mercor经理轻声责备了我。然而,几个小时后,他问我是否能在下周抽空。
我继续收到Mercor发来的带有“令人兴奋的新机会”和更多面试链接的电子邮件。
鉴于联邦拨款资助的不确定性,我不知道什么时候可能需要再次跟进。
与此同时,我还坚持做其他工作。我在学术岗位上的表现开始受到影响,但我认为老板理解我们都感受到了资金不确定性的压力。
我在稍显常规的兼职工作表现一直在提升,因为我逐渐掌握了他们希望我做的事情。其中一部分涉及我的经理建议我使用编码辅助工具。这是一个嵌入我编写的代码应用程序中的AI。我发现它既有分心的地方,也有错误和帮助之处。它在调整结构时也非常有用,比如重命名变量,它可以自动进一步执行,而不需要我进行查找替换。事实上,它特别热衷于复制、粘贴和重复。
然而,目前AI确实可以帮助我完成一些工作,因为我的某些工作是公式化和重复的,而且目前在某些方面,AI在某些任务上比一些人做得更好。这并不陌生——你的TI-89在乘法上就比你做得好。但是,随着输入AI训练模型的材料质量越来越高,模型和硬件不断改进(成本下降),这条界限会越来越高,会通过越来越多我们认为是人类的工作。
也许有一天我会决定告诉机器人我的佩雷克故事,也许它会比我同事更好地理解这个参考(或者,也许比我本人理解得更好)。AI的故事只会变得更加复杂和纠结。
因为我们首先面临的问题显然不会是AI成为超级智能,比所有人都更好的威胁;重要的讨论不是是否允许这种情况发生,也不是如何确保在我们还能控制的情况下让它的轨迹朝着善意而不是恶意发展。事实上,我认为这些问题是为了转移对真正问题的关注。
真正的第一个问题,无论我们是否愿意,或许很快就会到来:当人工智能变得比大多数人更便宜时,我们准备好了吗?
未来可能不再以人类为中心,甚至可能不再在人类的未来。
(以上内容均由Ai生成)