OpenAI 的 o3 在 2024 年国际信息学奥林匹克竞赛中夺金
快速阅读: 据《印度分析杂志》称,新研究显示,开放人工智能(OpenAI)的O3模型在编程竞赛平台CodeForces上获得2724分,位于第99.8百分位,并在2024年国际信息学奥林匹克(IOI)中获得金牌水平的分数,表现优于专门微调的模型。这表明强化学习比手工设计的方法更有效。研究表明,大型通用模型通过更强的推理能力在竞赛编程和软件工程中表现更佳。
新研究来自开放人工智能(OpenAI),强调了其推理模型(O系列模型)的结果以及大规模语言模型(LLMs)如何从参与业余竞赛的程序员发展到与世界顶级选手竞争。开放人工智能的最新AI模型O3在CodeForces上获得了令人印象深刻的2724分,位于第99.8百分位的位置。它还在2024年国际信息学奥林匹克(IOI)中获得了金牌水平的分数。根据研究,O3的表现优于专门针对IOI进行微调的O1-IOI模型。这表明强化学习比手工设计的方法更为有效。在2024年IOI中,O3在标准条件下参赛,并超过了金牌门槛。在CodeForces上,它在全球排名前200名,与顶尖的人类程序员一决高下。
“与其为特定任务构建专用系统,大型通用模型通过更强的推理能力可以取得更好的结果,”沃顿商学院副教授伊桑·莫利奇说。“通过强化学习开发的一般性推理能力现在正在超越精心设计的、特定领域的解决方案。”
这项研究是开放人工智能持续评估其模型在竞赛编程和更广泛的软件工程中的表现的一部分。负责开发克劳德系列模型的公司Anthropic也在周一发布了一份报告,强调了AI对工作场所的影响。研究发现,大约36%的工作岗位至少使用AI来处理四分之一的任务。此外,57%的AI应用增强了人类的能力,而43%的应用则侧重于自动化。然而,只有4%的职业依赖AI完成至少75%的任务。研究确认软件开发和技术写作是AI应用的主要领域。相比之下,在需要与环境进行物理互动的任务中,AI的作用较小。
(以上内容均由Ai生成)