OpenAI 宣布推出 o3 和 o4-mini,这是其最强大的模型,具有最先进的推理能力

发布时间:2025年4月17日    来源:szf
OpenAI 宣布推出 o3 和 o4-mini,这是其最强大的模型,具有最先进的推理能力

快速阅读: 据《Neowin.net》最新报道,开放人工智能发布新款推理模型O3和O4-mini,支持外部工具访问,显著提升推理能力。O3在多基准测试中达SOTA,O4-mini高效且具竞争力。两模型优化对话自然性并增强安全性。同时推出Codex CLI及支持计划,新模型逐步开放给不同用户群。

正如预期,开放人工智能(OpenAI)今日宣布了其最新推出的推理模型O3和O3-mini模型,在多项AI基准测试中取得了最先进的(SOTA)成果。首次,这些推理模型能够访问外部工具,包括网页浏览、Python解释器等功能。开放人工智能强调,这些新模型经过训练,能够推理何时以及如何使用工具,从而生成详细且符合正确输出格式的回复。凭借最先进的推理能力和全面的工具访问权限,用户可以期待比以往任何开放人工智能模型都更能有效地响应查询。

O3是该公司目前最强大的推理模型,在Codeforces、SWE-bench和MMMU上设定了新的SOTA基准。由于支持图像上传,用户可以利用它来分析图像、图表和图形。据外部专家表示,在复杂的实际任务中,O3相比O1减少了20%的重大错误。O4-mini是一款较小的模型,旨在快速且成本效益高的推理。尽管体积小,但在数学、编码和视觉任务中的表现与O3相当。例如,在AIME 2025中,当结合Python解释器时,O4-mini获得了99.5%的分数。由于其效率优于O3,用户可以期望更高的使用限制,使其非常适合处理大量推理任务。

开放人工智能声称,这两个新模型应该会感觉更自然和对话化,因为它们可以引用记忆和过去的对话。在幕后,开放人工智能使用大规模强化学习来提高性能,并通过强化学习训练这两个模型使用工具。在效率方面,对于大多数现实世界的应用场景,新的O3和O4-mini模型分别比O1和O3-mini更智能且更具性价比。在安全性方面,开放人工智能报告称,O3和O4-mini在所有三个类别的安全框架中均保持在“高”风险级别以下。

除了这些模型,开放人工智能还宣布了一项名为Codex CLI的新实验——一款轻量级的编码助手,供开发者直接在其电脑上使用。此外,该公司正在启动一项100万美元的计划,以支持利用Codex CLI和开放人工智能模型的项目。新的O4-mini、O4-mini-high和O3模型现在可通过模型选择器提供给ChatGPT Plus、Pro和Team用户。这些模型取代了O1、O3-mini和O3-mini-high。ChatGPT Enterprise和Edu用户将在下周获得访问权限。ChatGPT免费用户可以在文本编辑器中选择“思考”来体验O4-mini。

开放人工智能计划在未来几周内推出具备完整工具支持的OpenAI O3-Pro。O3模型的价格为每百万个输入令牌10美元,每百万个输出令牌40美元。O4-mini模型的定价与O3-mini相同:每百万个输入令牌1.10美元,每百万个输出令牌4.40美元。开发人员现在可以通过Chat Completion API和Responses API访问这些新模型。Responses API现在支持推理总结,并能在函数调用周围保留推理标记以提升性能。不久,开放人工智能将在模型的推理流程中加入对自家工具的支持,如网络搜索、文件搜索和代码解释器。

(以上内容均由Ai生成)

关键词: MiniO3O4Openai推理

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日