OpenAI 推出为行业创建自定义 AI 基准的计划
快速阅读: 据《Neowin.net》最新报道,OpenAI启动“开拓者计划”,旨在改进AI模型评估方式。通过与企业合作开发行业专属基准和定制化模型,解决垂直领域评估标准缺失的问题。入选企业可获OpenAI指导并利用强化微调技术优化模型,首批成员多为初创公司。此举推动AI技术在实际场景中的专业化应用。
OpenAI宣布了一项名为“开拓者计划”的举措,这项计划旨在推动人工智能在实际场景中的应用。该计划的目标是改进评估AI模型的方式,因为开发者和企业越来越依赖基准来做出明智的选择,挑选适合自身需求的AI模型并优化其在具体应用场景中的表现。
此前,Meta因被指控操控LMArena基准测试而受到批评,这导致Llama 4的排名一度高于其他模型。为了解决这一问题,开拓者计划邀请公司与OpenAI的研究人员合作,共同开发更具实际意义的基准,以反映真实世界中的挑战,而不仅仅是关注排行榜上的得分。
根据计划,入选的企业将获得OpenAI研究团队的亲自指导。该计划的重点成果包括两个方面:一是为每个行业量身定制特定领域的评估;二是构建专门针对公司业务三大主要应用场景进行微调的模型。法律、金融、医疗、保险及会计等垂直领域被明确列为定制基准的核心目标。OpenAI指出,在这些行业中,目前缺乏衡量AI性能的统一标准,这使得公平评估模型并找到改进方法变得困难。通过与这些垂直行业的公司直接合作,OpenAI希望定义某一领域的“优秀”标准,并将这些评估结果公开,供更多人参考。
计划的另一部分则是关于微调。参与公司将在强化微调(RFT)技术的支持下训练OpenAI模型的定制版本。这是OpenAI用于创建专注于特定任务的“专家”模型的一种方法。据OpenAI介绍,这些模型应具备生产级部署的能力。
首批成员将以几家初创公司为主,每家公司的入选都基于其在实际场景中的影响力。OpenAI表示,它正在寻找那些能够通过更智能、更专注的AI显著改善现实问题的团队。随着计划的逐步扩展,未来可能会涉及更大规模的企业以及更复杂的领域。
这一计划不仅体现了OpenAI对推动AI技术落地应用的决心,也标志着AI行业正朝着更加专业化、定制化的方向迈进。
(以上内容均由Ai生成)