AI

OpenAI推出gpt-oss-120b与20b,开发者迎狂欢

发布时间:2025年8月6日    来源:szf
OpenAI推出gpt-oss-120b与20b,开发者迎狂欢

快速阅读: 7月11日,美国旧金山,OpenAI推出开源模型gpt-oss-120b和gpt-oss-20b,参数分别为1170亿和210亿,支持本地部署和商业用途,旨在加速AI技术普及与创新,应对开源竞争。

7月11日,美国旧金山,OpenAI宣布推出两款开源权重语言模型——gpt-oss-120b和gpt-oss-20b。这是OpenAI自2019年发布GPT-2以来首次回归开源领域。此举不仅标志着OpenAI战略的重大转向,也为全球AI开发者提供了强大的推理工具,加速AI技术的普及与创新。

OpenAI在官方公告中表示,gpt-oss-120b和gpt-oss-20b采用Apache2.0许可证发布,允许开发者自由下载、修改和用于商业用途。这两款模型分别为1170亿参数和210亿参数的混合专家(MoE)架构,分别激活51亿和36亿参数,兼顾高效推理与低资源消耗。

gpt-oss-120b能够在单个NVIDIA H100 GPU(80GB内存)上运行,适用于数据中心或高端企业场景,性能接近OpenAI的专有模型o4-mini,尤其在竞赛编程(Codeforces)、通用问题解决(MMLU、HLE)及健康相关查询(HealthBench)方面表现突出。

gpt-oss-20b仅需16GB内存即可在边缘设备上运行,适用于本地推理和设备端应用,性能媲美o3-mini,特别是在竞赛数学(AIME2024&2025)等领域表现优异。

这些模型支持长达128k token的上下文长度,采用交替密集和局部带状稀疏注意力机制,并使用分组多查询注意力技术以提升推理效率。OpenAI还开源了“o200k_harmony”分词器,进一步降低开发门槛。

OpenAI在发布中强调,安全是gpt-oss系列的核心原则。针对开源模型可能被恶意微调的风险,OpenAI对gpt-oss-120b进行了对抗性微调测试,并通过其“准备框架”验证,确认即使经过恶意优化,模型在生物、化学及网络安全领域也未达到高风险能力水平。外部安全专家的审查进一步提升了模型的安全标准。

OpenAI呼吁开发者在使用模型时,结合自身需求实施额外安全措施,以应对多样化应用场景中的潜在风险。模型卡和研究论文中详细披露了安全测试结果,为开源社区提供了透明参考。

OpenAI此举被认为是应对开源领域竞争的战略调整。近年来,Meta、DeepSeek等公司通过开放模型抢占市场,迫使OpenAI重新审视其闭源策略。OpenAI首席执行官Sam Altman在Reddit AMA中曾表示,公司过去的开源路线“走错了方向”,此次发布则是兑现其回归开源承诺的第一步。

同时,gpt-oss系列满足了企业对本地化部署和数据隐私的需求。金融、医疗、法律等高监管行业可将模型部署在私有服务器上,避免数据泄露风险。OpenAI还与瑞典国家人工智能中心AI Sweden等机构合作,探索区域性微调以提升模型在特定语言和文化背景下的表现。

gpt-oss系列支持多种开发框架,如Transformers、vLLM、Ollama和llama.cpp,开发者可通过Hugging Face、GitHub等平台下载模型权重,并利用OpenAI提供的参考代码快速上手。模型内置链式推理(Chain-of-Thought)、工具调用(支持Python代码执行、网页搜索等)及结构化输出(JSON、YAML等),特别适合构建智能体工作流。

此外,模型支持三种推理等级(低、中、高),开发者可根据任务需求平衡速度与精度。

gpt-oss的发布不仅为开发者提供了高性能、低成本的AI工具,也对AI行业格局产生了深远影响。相较于Meta的Llama或DeepSeek的R1,gpt-oss在推理能力和工具使用上具有明显优势,但其文本单模态的限制也意味着需通过API调用补充多模态功能。

OpenAI表示,未来将根据社区反馈持续优化gpt-oss系列,但未承诺具体更新计划。业内专家认为,此举可能推动更多企业采用混合AI策略,即结合开源模型与云端服务,兼顾成本与灵活性。

(以上内容均由Ai生成)

你可能还想读

AI浏览器大战爆发,巨头争相布局未来

AI浏览器大战爆发,巨头争相布局未来

快速阅读: 本周《Vergecast》讨论ChatGPT Atlas及新AI浏览器频出,影响AI未来。探讨三星Galaxy XR可穿戴AI设备前景,关注华纳兄弟探索公司待售及其复杂历史。 本周在《Vergecast》节目中,我们讨论了Cha […]

发布时间:2025年10月24日
美国AI未来关键:数据中心而非妖魔化目标

美国AI未来关键:数据中心而非妖魔化目标

快速阅读: 美国数据中心发展面临公众反对与能源挑战,但其对AI及数字经济至关重要。如孟菲斯xAI项目,虽引发环保争议,却带来巨额投资与就业机会。 人工智能是一项定义时代的技术,其应用范围涵盖了国防、医疗、法律和金融等多个领域。在未来的十年里 […]

发布时间:2025年10月24日
OpenAI推多项改进,优化ChatGPT Atlas浏览器体验

OpenAI推多项改进,优化ChatGPT Atlas浏览器体验

快速阅读: OpenAI推出AI驱动浏览器ChatGPT Atlas,增加广告拦截、标签组支持等功能,提升用户体验,解决1Password等扩展程序兼容问题,计划开发Windows和Android版本。 日前,OpenAI宣布推出其人工智能 […]

发布时间:2025年10月24日
中国拟立法强化AI安全与发展

中国拟立法强化AI安全与发展

快速阅读: 中国《网络安全法》修正案草案将提交全国人大常委会审议,新增人工智能安全健康发展条款,旨在应对新挑战,加强个人数据保护,支持基础研究和关键算法创新,改善基础设施,建立伦理规范。 2025年7月26日,一名参观者在上海东部举行的20 […]

发布时间:2025年10月24日
Gemini新功能泄露:圈选图片区域获取AI信息

Gemini新功能泄露:圈选图片区域获取AI信息

快速阅读: 《Android Authority》报道,安卓平台Gemini新版本正开发一项功能,用户可圈选上传图片中的特定区域供AI处理,以获取更精确的图像信息。 《Android Authority》深入研究了安卓平台上的最新Gemin […]

发布时间:2025年10月24日
微软推出可爱AI助手Mico,重启Clippy新时代

微软推出可爱AI助手Mico,重启Clippy新时代

快速阅读: 微软发布Copilot秋季更新,推出Mico这一友好且具情感的AI形象,旨在实现更人性化的AI互动,支持可选图形助手,增强对话体验,融合情感与效率。 微软通过其Copilot秋季更新改变了我们与人工智能互动的方式。此次更新不仅带 […]

发布时间:2025年10月24日
EA联手Stability AI加速3D游戏设计

EA联手Stability AI加速3D游戏设计

快速阅读: Krafton宣布转型为AI主导公司,将在运营、学习、管理等领域嵌入AI技术,推进AI工作流程自动化及游戏内AI服务,提升游戏品质。 相关新闻, 《绝地求生》(PUBG)的开发商Krafton宣布将转型为以人工智能为主的公司,在 […]

发布时间:2025年10月24日
IBM在AMD芯片上实现量子算法,加速商业化进程

IBM在AMD芯片上实现量子算法,加速商业化进程

快速阅读: IBM宣布在AMD芯片上成功运行关键量子计算算法,标志超级计算机商业化进展。此算法可解决量子位错误,提前一年完成,计划2029年推出Starling量子计算机。 旧金山 — IBM于周五宣布,其能够在Advanced Micro […]

发布时间:2025年10月24日