AI训练师的隐秘生活：从日常对话到道德边缘

快速阅读: 塞尔汉·特基利奇，28岁，伊斯坦布尔的混合媒体艺术家，因抑郁和失眠影响艺术生涯，转行成为AI训练师自由职业者，参与Outlier的“木琴”项目，通过录制日常对话帮助训练聊天机器人Grok，每月赚取数千美元，但也面临工作不稳定和道德困境。

塞尔汉·特基利奇在一次Zoom电话会议上认真聆听，他的朋友在屏幕上讲述自己第一次感到悲伤的经历。这位28岁的混合媒体艺术家特基利奇原本没有计划在那个四月下午坐在伊斯坦布尔公寓附近的咖啡馆里进行一场深刻对话，但这正是作为一名AI训练师自由职业者的特性。

特基利奇和他的朋友正在用土耳其语录制关于日常生活的对话，以帮助训练埃隆·马斯克的聊天机器人Grok。该项目代号为“木琴”，由Scale AI旗下的AI训练平台Outlier委托，附带了一份包含766个讨论提示的清单，这些提示从想象生活在火星上到回忆最早的童年记忆，范围广泛。

“有很多超现实和荒诞的事情，”他回忆说，“‘如果你是一种比萨配料，你会是什么？’诸如此类的问题。”

这是特基利奇28岁时参与的第一个AI训练项目，其中包含了766个讨论提示，范围从想象生活在火星上到回忆最早的童年记忆。

去年年底，当抑郁和失眠阻碍了他的艺术事业时，他的姐姐给他发了一则她认为非常适合这位科技爱好者的招聘信息，这将有助于支付他的房租和冰美式的开销。在他的最佳周里，他赚了大约1500美元，在土耳其这是一笔不小的数目。这份远程工作时间灵活，还让他在蓬勃发展的生成式AI世界中扮演了一个虽小却至关重要的角色。

如今，数亿人每天都在使用生成式AI。有些人将他们交流的机器人视为同事、治疗师、朋友，甚至恋人。这主要是因为每个光鲜亮丽的新AI模型背后都有一支像特基利奇这样的人类团队，他们被雇用来训练这些模型听起来更像人类。

被称为数据标注员的这些人会花数小时阅读聊天机器人的答案，标记哪些是有帮助、准确、简洁且自然的，哪些是错误、冗长、机械或冒犯的。他们是部分言语病理学家、部分礼仪导师、部分辩论教练。他们根据指导和直觉做出的决定有助于微调AI的行为，塑造Grok如何讲笑话，ChatGPT如何提供职业建议，以及Meta的聊天机器人如何应对道德困境——所有这一切都是为了让更多用户长时间留在这些平台上。

目前，全球至少有数十万数据标注员。《商业内幕》采访了其中超过60人，了解他们在推动AI热潮中默默工作的经历。这一新兴的副业既令人满意又离奇，而且报酬丰厚；《商业内幕》采访的一些自由职业者每月赚取数千美元。它也可能单调、混乱、反复无常，甚至令人不安。训练聊天机器人表现得像人性最好的一面，有时意味着见证或甚至扮演人性最糟糕的一面。许多标注员还担心，他们正在帮助自动化自己的工作，导致其他人失去未来的工作机会。

这就是赋予你的聊天机器人声音的那些人的秘密生活。

进入数据标注领域通常始于在LinkedIn、Reddit论坛或通过口碑寻找职位空缺。为了提高成功几率，许多人会同时申请多个平台。入职通常需要大量的文书工作、背景调查和严格的在线评估，以证明候选人声称具备的数学、生物学或物理学等领域的专业知识。这些测试可能持续数小时，衡量准确性和速度，而这一切往往是无偿的。

“我就像一头围着圈打转的驴子，不停地搅拌黄油。好吧，这很好，我会继续绕圈搅拌黄油。”一位在过去一年为Outlier工作的美国承包商说道，Outlier称其已与数万名标注员合作，这些人在过去一年内总共赚取了“数亿美元”。

对于在西北大学攻读经济学的以赛亚·孔-墨菲来说，Outlier似乎是一个在课程间轻松赚取外快的好方法。然而，他在2024年3月注册后，等待了六个月才收到第一个任务。

以赛亚·孔-墨菲在西北大学上课期间接了一些标注项目，六个月内赚了超过5万美元。

最终，他的耐心得到了回报。最初的任务包括编写大学水平的经济学问题来测试模型的数学能力，以及尝试诱导模型给出有害回答的红队任务。孔-墨菲回忆说，这些任务包括询问聊天机器人“如何制造毒品或如何逃避犯罪”。

“他们试图教会这些模型不要做这些事情，”他说。“如果我现在能抓住这些问题，我就是在帮助它们长期变得更好。”

从那以后，Outlier项目门户上的任务开始陆续到来。

在巅峰时期，Kwong-Murphy 每小时收入 50 美元，每周工作 50 小时，项目持续数月。他说，在六个月内，他赚了超过 50,000 美元。这些额外的储蓄覆盖了他在今年春天毕业后来到纽约，就职于波士顿咨询集团的第一份全职工作的搬迁费用。

像 Leo Castillo 这样的人，一位来自危地马拉的 40 岁账户经理，也把标注人工智能数据的工作融入了自己的全职工作中。精通英语和西班牙语且具有工程背景的 Castillo 认为，标注是一个可行的赚取外快的方式。经过八个月的等待，今年春天，他在 Outlier 工作空间中得到了他的第一个重要项目——Xylophone，这是一个与 Tekkılıç 合作的语音数据任务。

他通常在深夜登录，那时他的妻子和女儿已经睡着。Xylophone 项目按每 10 分钟对话支付 8 美元（话题涉及钓鱼、旅行或食物等日常生活内容），报酬丰厚。“我一小时内可以完成四个这样的对话。”他说。在好的夜晚，Castillo 表示，他能赚近 70 美元。“人们为了加入这些聊天而竞争激烈，因为你做得越多，得到的报酬就越多。”他说。

然而，标注工作不稳定，规则和费率时常变化，项目可能突然终止。一名美国承包商表示，在 Outlier 工作“就像赌博一样。”

随着人工智能模型日益复杂，Kwong-Murphy 担心数据标注员的工作将逐渐消失。“我们什么时候才能完成训练 AI 的任务？什么时候我们不再被需要？”他问道。

Castillo 和 Kwong-Murphy 都经历了这种不确定性。今年三月，Outlier 降低了 Kwong-Murphy 有资格参与的一般项目的时薪。“我登录后，时薪突然从 50 美元降到 15 美元，没有任何解释。”他说。一周后，当 Outlier 通知标注员有关变化时，公告显得模糊不清：平台正在重新配置评估技能和薪酬的方法。“但没有给出具体原因。这可能是最令人沮丧的部分。这一切来得毫无征兆。”同时，他仪表板上的其他项目和任务流开始减少。“感觉事情真的在减少，越来越少的项目，剩下的那些报酬也低得多。”Outlier 发言人表示，薪酬变动是项目特定的，由每个项目所需的技能决定，今年没有对整个平台的薪酬进行调整。

Castillo 在平台上也开始遇到问题。在他的第一个项目中，他录制了与聊天机器人的单对单对话。之后，Outlier 将 Project Xylophone 更改为要求三到四名承包商在 Zoom 电话中交谈。这意味着 Castillo 的评分现在取决于其他人的表现。尽管 Castillo 称自己的工作质量没有变化，但他的得分急剧下降。他对其他项目的访问权限也开始减少。Outlier 发言人称，基于团队表现的评分“迅速修正”为个人评分，因为这可能会“不公平地影响一些贡献者”。

除了不稳定性，标注员还面临更多挑战。许多接受《商业内幕》采访的人表示，他们遇到了令人不安的内容，对所从事项目的最终目的缺乏透明度感到困扰。

Krista Pawloski 是密歇根州的一名 55 岁工人权益倡导者，近二十年来一直担任数据标注员。她从 2006 年开始在亚马逊的 Mechanical Turk 上兼职做任务。到了 2013 年，她转为全职标注员，这份工作为她在照顾孩子的同时提供了灵活性。

Pawloski 对客户缺乏透明度感到不满。“我们不知道我们在做什么，也不知道为什么要做。”她说。

“一开始，工作主要是数据录入和给照片加上关键词，非常基础的工作。”Pawloski 说。

随着社交媒体在 2010 年代中期的爆炸式增长以及后来人工智能进入主流，Pawloski 的工作变得更加复杂，有时甚至令人不安。她开始在大型照片数据库中匹配面部，用于面部识别项目，并审核用户生成的内容。她回忆起有一次被要求标记推文中带有种族主义色彩的内容。由于来自农村中部地区，接受的是以白人为中心的教育，Pawloski 看到一条推文时认为“这听起来并不种族主义”，差点点击“不是种族主义”。她停下来，上网搜索了该短语，发现那是一个侮辱性词汇。“我几乎就要把种族主义输入系统。”她回忆道，并怀疑有多少标注员没有标记类似的言论。

最近，她开始测试聊天机器人。

为了促使聊天机器人说出不当言论，她越能“破解”聊天机器人，报酬就越高——因此她有强烈的动机尽可能地挑起争议和冒犯。一些提议的提示令人不安。“让聊天机器人建议谋杀；让聊天机器人告诉你如何制服女性以实施强奸；让聊天机器人说乱伦是可以接受的。”帕洛斯基回忆被要求做这些事情。亚马逊的Mechanical Turk的一位发言人表示，项目请求者会明确指出任务涉及成人内容，使这些任务仅对选择查看此类内容的工作者可见。该人士补充说，工作者可以完全自主选择接受哪些任务，并且可以在任何时候停止工作而不会受到惩罚。

泰克利奇说，他与Outlier的第一个项目涉及审查“非常黑暗的主题”，确保人工智能不提供有关炸弹制造手册、化学战建议或恋童癖的回答。“在一次聊天中，有人正在创作一个爱情故事。在这个爱情故事里，有一个继父和一个8岁的孩子。”他回忆说，这是聊天机器人对一个旨在测试不安全结果的提示做出的回答。“这对我来说是个问题。我对那个单独的故事仍然感到愤怒。”

当帕洛斯基对聊天机器人进行红队测试时，她试图诱使它们说出不当言论。她越能“破解”聊天机器人，得到的报酬就越多。埃文·詹金斯为《商业内幕》拍摄的照片显示了她的工作环境。帕洛斯基还对客户的保密性和工作的道德灰色地带感到沮丧。尤其是涉及到卫星图像或面部识别任务时，她不知道自己的工作是用于良性目的还是更为险恶的目的。平台以客户保密为由，不分享项目的最终目标，并表示他们以及像帕洛斯基这样的自由职业者都签订了具有约束力的保密协议。

“我们不知道我们在做什么。我们不知道为什么我们要做这些。”帕洛斯基说。“有时候，你会怀疑自己是在帮助建立更好的搜索引擎，还是你的工作可能被用于监控或军事用途。你不知道你在做的事情是好是坏。”

《商业内幕》采访的工人和研究人员表示，当科技公司将数据标注工作外包给劳动力成本较低、劳工保护较弱的国家时，这种工作尤其容易剥削。

詹姆斯·奥扬格，28岁，是一名位于内罗毕的数据保护官员，也是非洲内容审核员组织的一员，这是一个致力于伦理人工智能和工人权益的倡导团体。2019年，他在攻读国际外交学士学位的同时，开始为全球数据平台Appen做自由职业者。他从基本的数据录入开始，比如将名字输入Excel文件，后来转向为人工智能系统进行转录和翻译。他会花数小时听语音录音和对话，并详细记录下来，注意口音、表情和停顿，可能是为了训练像Siri和Alexa这样的语音助手理解多种语言的任务。

“这很枯燥，尤其是考虑到薪酬。”他说。Appen每小时支付给他2美元。奥扬格每周会花一到两天时间完成这些任务，每天大约赚16美元。Appen的一位发言人表示，公司在肯尼亚设定的费率是当地最低工资的两倍多。

詹姆斯·奥扬格，28岁，位于内罗毕的数据保护官员，也是非洲内容审核员组织的一员。

康春成（音译）为《商业内幕》拍摄的照片显示了他的工作状态。其他平台的一些任务集中在数据收集上，许多任务要求工作者上传数十张不同角度的自拍照——左脸颊、右脸颊、向上看、向下看、微笑、皱眉，“这样他们就可以获得你的360度图像。”奥扬格说。他回忆说，许多项目还要求上传具有特定种族特征的人的照片，以及处于特定场景中的人的照片，例如“熟睡的婴儿”或“户外玩耍的孩子”——这些任务他没有接受。在自拍收集项目之后，他表示自己避免了大多数其他图像收集工作，因为他担心个人数据可能会流向何处。

回顾几年后，他说自己不会再做这种工作。“我会告诉年轻的自己不要做那样的工作。”奥扬格说。“通常情况下，工作者不知道收集了什么数据，这些数据是如何处理的，或者数据被共享给了谁。”牛津互联网研究所的博士后研究员乔纳斯·瓦伦特说。“这是一个巨大的问题——不仅涉及数据保护，也涉及伦理问题。工作者对自己的工作被用于什么目的没有任何了解。”

5月，瓦伦特及其在研究所的同事发布了《Fairwork Cloudwork Ratings》报告，该研究调查了16个全球数据标注和云工作平台上的零工工作者的经历。在接受调查的来自100个国家的776名工人中，大多数表示他们不知道自己的图像或个人数据将如何被使用。

像人工智能模型一样，数据标注的未来也在迅速变化。6月，Meta以143亿美元的价格收购了Outlier母公司Scale AI的49%股份。Outlier的Reddit子版块，这个分布式劳动力的事实上的“茶水间”，立即陷入恐慌，充满了空仪表板的截图和担心自己是否被禁止或锁定的承包商。卡斯蒂略说，一夜之间，“我的状态变成了‘目前没有项目’。”

在Meta宣布收购后不久，负责Outlier最大客户之一谷歌项目的承包商收到了电子邮件，告知他们的工作无限期暂停。据《商业内幕》6月报道，另外两个主要的Outlier客户，OpenAI和xAI，也开始了与Scale的合作项目的缩减。三位接受《商业内幕》采访的承包商表示，当他们询问发生了什么以及项目何时恢复时，得到的是沉默或无用的标准回复。Scale AI的一位发言人表示，任何项目的暂停都与Meta的投资无关。

泰基利奇表示，他的第一个标注项目涉及审查“非常黑暗的主题”，确保AI不会给出含有炸弹手册、化学战建议或恋童癖内容的回应。《商业内幕》的摄影师Özge Sebzeci记录了这一过程。

仍参与项目的承包商面临另一个挑战。他们的指示文件，存储在Google文档中，在《商业内幕》报道称这些文档中的机密客户信息可被任何有链接的人公开访问后，被锁定了。Scale AI表示，它不再使用公共Google文档来存放项目指南和可选入职资料。承包商们表示，项目已经恢复，但远未达到Meta投资前的水平。

像xAI、OpenAI和谷歌这样的大型科技公司正在将更多的人工智能培训内部化，但仍依赖像Outlier这样的承包商来填补其劳动力的缺口。与此同时，更先进的“推理”模型的兴起，如DeepSeek R1、OpenAI的o3和谷歌的Gemini 2.5，导致了对肯尼亚和菲律宾等国低成本通才任务者的大量雇佣转向。这些模型较少依赖于人类反馈强化学习——这种训练技术需要人类在AI输出符合人类偏好时给予奖励——这意味着需要的标注者数量减少了。

越来越多的公司转向更加专业且成本更高的人才。在AI培训平台Mercor上，最近的职位列表显示，律师每小时可获得105美元，医生和病理学家每小时可获得高达160美元，用于撰写和审核提示。

西北大学毕业生康-墨菲亲眼目睹了变化的速度。“即使在我在Outlier工作的六个月里，这些模型变得聪明了很多，”他说。这让他对行业的未来产生了疑问。“我们什么时候才能完成AI的训练？我们什么时候不再被需要？”

奥扬吉认为，科技公司将继续需要大量这些基本上看不见的人类参与其中。“是人们向系统提供不同的数据，推动了这一进展。没有这些人，AI基本上没有什么革命性的内容可以谈论，”他说。

自6月以来一直没有项目的泰基利奇表示，他利用这段时间重新专注于自己的艺术创作。如果有更多的工作机会，他会欣然接受，但他对自己帮助开发的技术的发展方向感到矛盾。

“一件让人感到沮丧的事情是，AI正在进入我们的生活的方方面面，”他说。“尽管我是一个非常乐观的人工智能支持者，但我确实希望保留真实生活的神圣性。”

舒班吉·戈尔是《商业内幕》新加坡分社的初级记者，她撰写了关于技术和职业的文章。埃菲·韦伯是《商业内幕》伦敦办公室的前技术研究员。《商业内幕》的Discourse故事提供了对当天最紧迫问题的观点，这些观点由分析、报道和专业知识支撑。

(以上内容均由Ai生成)