AI

OpenAI推出gpt-oss-120b与20b,开发者迎狂欢

发布时间:2025年8月6日    来源:szf
OpenAI推出gpt-oss-120b与20b,开发者迎狂欢

快速阅读: 7月11日,美国旧金山,OpenAI推出开源模型gpt-oss-120b和gpt-oss-20b,参数分别为1170亿和210亿,支持本地部署和商业用途,旨在加速AI技术普及与创新,应对开源竞争。

7月11日,美国旧金山,OpenAI宣布推出两款开源权重语言模型——gpt-oss-120b和gpt-oss-20b。这是OpenAI自2019年发布GPT-2以来首次回归开源领域。此举不仅标志着OpenAI战略的重大转向,也为全球AI开发者提供了强大的推理工具,加速AI技术的普及与创新。

OpenAI在官方公告中表示,gpt-oss-120b和gpt-oss-20b采用Apache2.0许可证发布,允许开发者自由下载、修改和用于商业用途。这两款模型分别为1170亿参数和210亿参数的混合专家(MoE)架构,分别激活51亿和36亿参数,兼顾高效推理与低资源消耗。

gpt-oss-120b能够在单个NVIDIA H100 GPU(80GB内存)上运行,适用于数据中心或高端企业场景,性能接近OpenAI的专有模型o4-mini,尤其在竞赛编程(Codeforces)、通用问题解决(MMLU、HLE)及健康相关查询(HealthBench)方面表现突出。

gpt-oss-20b仅需16GB内存即可在边缘设备上运行,适用于本地推理和设备端应用,性能媲美o3-mini,特别是在竞赛数学(AIME2024&2025)等领域表现优异。

这些模型支持长达128k token的上下文长度,采用交替密集和局部带状稀疏注意力机制,并使用分组多查询注意力技术以提升推理效率。OpenAI还开源了“o200k_harmony”分词器,进一步降低开发门槛。

OpenAI在发布中强调,安全是gpt-oss系列的核心原则。针对开源模型可能被恶意微调的风险,OpenAI对gpt-oss-120b进行了对抗性微调测试,并通过其“准备框架”验证,确认即使经过恶意优化,模型在生物、化学及网络安全领域也未达到高风险能力水平。外部安全专家的审查进一步提升了模型的安全标准。

OpenAI呼吁开发者在使用模型时,结合自身需求实施额外安全措施,以应对多样化应用场景中的潜在风险。模型卡和研究论文中详细披露了安全测试结果,为开源社区提供了透明参考。

OpenAI此举被认为是应对开源领域竞争的战略调整。近年来,Meta、DeepSeek等公司通过开放模型抢占市场,迫使OpenAI重新审视其闭源策略。OpenAI首席执行官Sam Altman在Reddit AMA中曾表示,公司过去的开源路线“走错了方向”,此次发布则是兑现其回归开源承诺的第一步。

同时,gpt-oss系列满足了企业对本地化部署和数据隐私的需求。金融、医疗、法律等高监管行业可将模型部署在私有服务器上,避免数据泄露风险。OpenAI还与瑞典国家人工智能中心AI Sweden等机构合作,探索区域性微调以提升模型在特定语言和文化背景下的表现。

gpt-oss系列支持多种开发框架,如Transformers、vLLM、Ollama和llama.cpp,开发者可通过Hugging Face、GitHub等平台下载模型权重,并利用OpenAI提供的参考代码快速上手。模型内置链式推理(Chain-of-Thought)、工具调用(支持Python代码执行、网页搜索等)及结构化输出(JSON、YAML等),特别适合构建智能体工作流。

此外,模型支持三种推理等级(低、中、高),开发者可根据任务需求平衡速度与精度。

gpt-oss的发布不仅为开发者提供了高性能、低成本的AI工具,也对AI行业格局产生了深远影响。相较于Meta的Llama或DeepSeek的R1,gpt-oss在推理能力和工具使用上具有明显优势,但其文本单模态的限制也意味着需通过API调用补充多模态功能。

OpenAI表示,未来将根据社区反馈持续优化gpt-oss系列,但未承诺具体更新计划。业内专家认为,此举可能推动更多企业采用混合AI策略,即结合开源模型与云端服务,兼顾成本与灵活性。

(以上内容均由Ai生成)

你可能还想读

中国规划未来五年科技自立,重点发展芯片与AI

中国规划未来五年科技自立,重点发展芯片与AI

快速阅读: 中国最高领导人规划2026至2030年第15个五年计划,聚焦科技自立和创新驱动,尤其在半导体、AI领域加大投入,目标克服技术瓶颈,提升国际竞争力。 本周,中国最高领导人在北京召开高级政治会议,规划从2026年至2030年的下一个 […]

发布时间:2025年10月25日
AI工具检测寄生虫超越人类,研究发现

AI工具检测寄生虫超越人类,研究发现

快速阅读: ARUP实验室开发的AI工具能更快、更准地检测粪便样本中的寄生虫,超越传统方法。该工具使用卷积神经网络,经4000多例样本训练,敏感度高于人类专家,有助于早期诊断和治疗。 科学家们在ARUP实验室开发了一种人工智能(AI)工具, […]

发布时间:2025年10月25日
日产推出鸟形AI伴侶Eporo,车内互动新体验

日产推出鸟形AI伴侶Eporo,车内互动新体验

快速阅读: 日产推出Eporo,结合实体玩偶与数字虚拟形象,为用户提供导航、天气信息等服务,通过自然语言对话互动,旨在建立亲密感。此外,日产还展示Diorama Navi,结合复古音响系统,提供新颖驾驶体验。 日产宣布推出一款名为Eporo […]

发布时间:2025年10月25日
AI双面影响:推动与阻碍全球脱碳进程

AI双面影响:推动与阻碍全球脱碳进程

快速阅读: 全球能源需求因人工智能整合激增,对电网构成挑战,专家称此问题短期内难解。为满足数据中心需求,清洁能源和化石燃料项目投资增加,但基础设施能否应对需求存疑,能源成本上升引发跨党派反对。 人工智能在推动和阻碍脱碳方面发挥着双重作用 全 […]

发布时间:2025年10月25日
三星电子与软银签署AI-RAN合作备忘录,共研6G技术

三星电子与软银签署AI-RAN合作备忘录,共研6G技术

快速阅读: 三星电子与软银签署MoU,共同研发6G及AI-RAN技术,涵盖6G、AI在RAN中的应用等四大领域。双方将利用各自优势探索新应用场景,提升网络性能和用户体验。 三星电子和软银签署了一份谅解备忘录(MoU),共同研究和开发下一代通 […]

发布时间:2025年10月25日
保罗·施拉德称找到完美AI剧本,预测AI电影时代来临

保罗·施拉德称找到完美AI剧本,预测AI电影时代来临

快速阅读: 奥斯卡提名者保罗·施拉德看好AI在电影业的应用,称已读到“完全由AI完成的完美剧本”,预计首部全AI电影两年内问世。施拉德认为AI是工具,能创造人脸和表情,将成为公正的电影评论家。 希望蒂莉·诺伍德已经签约了经纪人,因为保罗·施 […]

发布时间:2025年10月25日
AI赋能教育:个性化辅导惠及全球学生

AI赋能教育:个性化辅导惠及全球学生

快速阅读: 萨尔·汗,可汗学院创始人,推出AI教学助手Khanmigo,提供个性化辅导,覆盖190国,使用55种语言,旨在解决学生学习进度落后问题,提高教育质量。 萨尔·汗,非营利组织可汗学院的创始人兼首席执行官。摄影:David Paul […]

发布时间:2025年10月25日
Anthropic与谷歌达成数十亿美元AI芯片协议

Anthropic与谷歌达成数十亿美元AI芯片协议

快速阅读: Anthropic扩大与谷歌合作,购买百万TPU,预计2026年新增一吉瓦算力,满足Claude模型需求增长。 Anthropic拥有30万企业客户,估值1830亿美元,新模型Claude Sonnet 4.5被誉为最佳编程AI […]

发布时间:2025年10月25日