为什么马克·扎克伯格（Mark Zuckerberg）将 140 亿美元的赌注押在一家 AI 初创公司上

发布时间：2025年6月27日来源：szf

快速阅读: 据《商业内幕》最新报道，训练AI需大量人力，RLHF是关键方法。Scale AI平台Remotasks有24万用户，但研究发现他们更倾向复制ChatGPT答案，导致被封禁。

训练人工智能模型需要大量的人力劳动。提高模型的一个关键方法是基于人类反馈的强化学习，即 RLHF。Scale AI 最大的平台 Remotasks 拥有超过 24 万名人力参与者从事这项工作。颇具讽刺意味的是，自动化反而成了一种问题：研究结果显示，这些用户更愿意从 ChatGPT 复制粘贴答案，而不是提供真实的反馈。我们注意到，许多用户因在 Scale AI 平台上复制粘贴答案而被封禁。

(以上内容均由Ai生成)