OpenAI 发布新模型,支持自定义安全策略应对风险

发布时间:2025年11月1日    来源:szf
OpenAI 发布新模型,支持自定义安全策略应对风险

快速阅读: OpenAI发布gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款新模型,支持自定义安全策略,提升分类灵活性与适应性,适用于多种安全需求,但也存在资源消耗大等问题。

近日,OpenAI 发布了两款新型开放式权重模型,分别为 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,主要应用于 AI 安全领域。这两款模型在先前的 gpt-oss 系列基础上进行了优化,继续遵循 Apache 2.0 许可证,允许用户自由使用、修改及部署。

新模型的一大亮点在于,它们赋予了开发者根据自定义安全策略进行推理分类的能力,突破了传统“一刀切”的安全体系。开发者可以在推理过程中输入自己的安全策略和待检测内容,模型会依据这些策略进行分类,并给出相应的推理依据。安全策略的灵活性提高了模型的适应性和表现力,使其能够对用户消息、聊天回复乃至完整对话进行分类,满足不同场景的需求。

OpenAI 强调,这些新模型特别适用于以下几种情况:当潜在威胁正在出现或变化时,安全策略需迅速调整;在某些细分领域,传统的小型分类器难以有效应对;在开发者缺乏高质量样本的情况下,难以训练出高效的分类器;以及在分类结果的质量和可解释性比处理速度更重要的场合,这些新模型成为理想选择。

不过,gpt-oss-safeguard 也有其局限性。OpenAI 指出,若平台拥有大量标注样本并能训练传统分类器,在复杂或高风险环境中,后者可能表现更优,定制化模型的精度更高。同时,新模型在处理速度和资源消耗方面较大,不适合大规模实时内容审查。

目前,gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 已在 Hugging Face 平台上免费提供,便于广大开发者探索和应用。链接如下:https://huggingface.co/collections/openai/gpt-oss-safeguard

要点总结:

– OpenAI 推出了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款新型安全模型,支持灵活自定义安全策略。

– 新模型可根据输入的安全策略对用户消息和对话进行分类,并提供推理依据。

– 尽管新模型具备多项优势,但在特定情况下,传统分类器可能更为有效,且新模型对资源的消耗较大。

(以上内容均由Ai生成)

你可能还想读

谷歌更新Nest系列设备LED灯,Gemini语音助手添新彩

谷歌更新Nest系列设备LED灯,Gemini语音助手添新彩

快速阅读: 谷歌通过“Gemini for Home”语音助手更新了Home Mini、Nest Mini和Nest Audio的LED灯行为,Nest Audio新增彩虹渐变效果,不同灯光模式表示设备状态,如思考、回应等,第一代和第二代M […]

发布时间:2025年11月2日
SK集团引领APEC峰会AI与能源对话

SK集团引领APEC峰会AI与能源对话

快速阅读: 2025年APEC CEO峰会于10月29日至31日召开,聚焦AI与能源发展。SK集团展示AI创新,推进AI与能源合作,强化区域经济与技术交流。 2025年亚太经济合作组织(APEC)CEO峰会圆满结束四天议程,吸引了来自21个 […]

发布时间:2025年11月2日
Roblox推出AI年龄估算系统,股价下跌引发投资者担忧

Roblox推出AI年龄估算系统,股价下跌引发投资者担忧

快速阅读: Roblox推出新AI系统,用于估算用户年龄,计划年底前完成。此举针对未成年人保护,但可能影响用户体验,导致股价下跌。第三季度收入增长48%,达13.6亿美元。 Roblox近日公布了一项重要的新安全系统,该系统将利用人工智能来 […]

发布时间:2025年11月2日
损耗可减少近 50%,安森美宣布出样垂直氮化镓功率半导体

损耗可减少近 50%,安森美宣布出样垂直氮化镓功率半导体

快速阅读: 安森美推出垂直氮化镓(vGaN)功率半导体,采用同质衬底技术,实现更高电压和更快开关频率,体积减小三分之二,损耗降低50%,适用于AI数据中心、电动汽车等领域。 IT之家 11 月 2 日消息,onsemi 安森美当地时间 10 […]

发布时间:2025年11月2日
英伟达发布 Omniverse DSX,助力 GW 级 AI 工厂建设

英伟达发布 Omniverse DSX,助力 GW 级 AI 工厂建设

快速阅读: 英伟达推出Omniverse DSX,用于设计和运营GW级AI工厂,实现建筑、供电和冷却与AI基础设施协同设计,支持100MW至数GW级别建设,提升GPU生产力和能效。 英伟达创始人兼首席执行官黄仁勋在上月末的 GTC 华盛顿特 […]

发布时间:2025年11月2日
亚马逊 AWS 启用全球最大 AI 集群 Project Rainier

亚马逊 AWS 启用全球最大 AI 集群 Project Rainier

快速阅读: 亚马逊AWS宣布Project Rainier AI计算集群正式运营,配备近50万颗Trainium2芯片,计算能力提升5倍,Anthropic等合作伙伴已开始使用,预计2025年扩展至100万颗芯片。 11月2日,据IT之家报 […]

发布时间:2025年11月2日
AI为何常编造不实信息?训练方式成关键

AI为何常编造不实信息?训练方式成关键

快速阅读: 研究人员指出,AI模型如ChatGPT可能因训练方式产生“幻觉”,即编造不真实信息。模型通过概率计算生成答案,缺乏真实数据时易出错。OpenAI建议模型表达不确定性以减少幻觉,但实施难度大。 为什么人工智能会编造不真实的信息? […]

发布时间:2025年11月2日
PayPal携手OpenAI推出智能支付新体验

PayPal携手OpenAI推出智能支付新体验

快速阅读: PayPal公布强劲Q3业绩,收入增长7%至84.2亿美元,EPS超预期;宣布与OpenAI合作,将AI购物助手整合至PayPal支付系统,股价上涨但仍较年初下跌14%。 在公司公布强劲的第三季度业绩并宣布与OpenAI的新合作 […]

发布时间:2025年11月2日