OpenAI 推出为行业创建自定义 AI 基准的计划

发布时间：2025年4月10日来源：szf

快速阅读: 据《Neowin.net》最新报道，OpenAI启动“开拓者计划”，旨在改进AI模型评估方式。通过与企业合作开发行业专属基准和定制化模型，解决垂直领域评估标准缺失的问题。入选企业可获OpenAI指导并利用强化微调技术优化模型，首批成员多为初创公司。此举推动AI技术在实际场景中的专业化应用。

OpenAI宣布了一项名为“开拓者计划”的举措，这项计划旨在推动人工智能在实际场景中的应用。该计划的目标是改进评估AI模型的方式，因为开发者和企业越来越依赖基准来做出明智的选择，挑选适合自身需求的AI模型并优化其在具体应用场景中的表现。

此前，Meta因被指控操控LMArena基准测试而受到批评，这导致Llama 4的排名一度高于其他模型。为了解决这一问题，开拓者计划邀请公司与OpenAI的研究人员合作，共同开发更具实际意义的基准，以反映真实世界中的挑战，而不仅仅是关注排行榜上的得分。

根据计划，入选的企业将获得OpenAI研究团队的亲自指导。该计划的重点成果包括两个方面：一是为每个行业量身定制特定领域的评估；二是构建专门针对公司业务三大主要应用场景进行微调的模型。法律、金融、医疗、保险及会计等垂直领域被明确列为定制基准的核心目标。OpenAI指出，在这些行业中，目前缺乏衡量AI性能的统一标准，这使得公平评估模型并找到改进方法变得困难。通过与这些垂直行业的公司直接合作，OpenAI希望定义某一领域的“优秀”标准，并将这些评估结果公开，供更多人参考。

计划的另一部分则是关于微调。参与公司将在强化微调（RFT）技术的支持下训练OpenAI模型的定制版本。这是OpenAI用于创建专注于特定任务的“专家”模型的一种方法。据OpenAI介绍，这些模型应具备生产级部署的能力。

首批成员将以几家初创公司为主，每家公司的入选都基于其在实际场景中的影响力。OpenAI表示，它正在寻找那些能够通过更智能、更专注的AI显著改善现实问题的团队。随着计划的逐步扩展，未来可能会涉及更大规模的企业以及更复杂的领域。

这一计划不仅体现了OpenAI对推动AI技术落地应用的决心，也标志着AI行业正朝着更加专业化、定制化的方向迈进。

(以上内容均由Ai生成)