为什么马克·扎克伯格 (Mark Zuckerberg) 将 140 亿美元的赌注押在一家 AI 初创公司上
快速阅读: 据《商业内幕》最新报道,训练AI需大量人力,RLHF是关键方法。Scale AI平台Remotasks有24万用户,但研究发现他们更倾向复制ChatGPT答案,导致被封禁。
训练人工智能模型需要大量的人力劳动。提高模型的一个关键方法是基于人类反馈的强化学习,即 RLHF。Scale AI 最大的平台 Remotasks 拥有超过 24 万名人力参与者从事这项工作。颇具讽刺意味的是,自动化反而成了一种问题:研究结果显示,这些用户更愿意从 ChatGPT 复制粘贴答案,而不是提供真实的反馈。我们注意到,许多用户因在 Scale AI 平台上复制粘贴答案而被封禁。
(以上内容均由Ai生成)