OpenAI 发布新模型,支持自定义安全策略应对风险

发布时间:2025年11月1日    来源:szf
OpenAI 发布新模型,支持自定义安全策略应对风险

快速阅读: OpenAI发布gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款新模型,支持自定义安全策略,提升分类灵活性与适应性,适用于多种安全需求,但也存在资源消耗大等问题。

近日,OpenAI 发布了两款新型开放式权重模型,分别为 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,主要应用于 AI 安全领域。这两款模型在先前的 gpt-oss 系列基础上进行了优化,继续遵循 Apache 2.0 许可证,允许用户自由使用、修改及部署。

新模型的一大亮点在于,它们赋予了开发者根据自定义安全策略进行推理分类的能力,突破了传统“一刀切”的安全体系。开发者可以在推理过程中输入自己的安全策略和待检测内容,模型会依据这些策略进行分类,并给出相应的推理依据。安全策略的灵活性提高了模型的适应性和表现力,使其能够对用户消息、聊天回复乃至完整对话进行分类,满足不同场景的需求。

OpenAI 强调,这些新模型特别适用于以下几种情况:当潜在威胁正在出现或变化时,安全策略需迅速调整;在某些细分领域,传统的小型分类器难以有效应对;在开发者缺乏高质量样本的情况下,难以训练出高效的分类器;以及在分类结果的质量和可解释性比处理速度更重要的场合,这些新模型成为理想选择。

不过,gpt-oss-safeguard 也有其局限性。OpenAI 指出,若平台拥有大量标注样本并能训练传统分类器,在复杂或高风险环境中,后者可能表现更优,定制化模型的精度更高。同时,新模型在处理速度和资源消耗方面较大,不适合大规模实时内容审查。

目前,gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 已在 Hugging Face 平台上免费提供,便于广大开发者探索和应用。链接如下:https://huggingface.co/collections/openai/gpt-oss-safeguard

要点总结:

– OpenAI 推出了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款新型安全模型,支持灵活自定义安全策略。

– 新模型可根据输入的安全策略对用户消息和对话进行分类,并提供推理依据。

– 尽管新模型具备多项优势,但在特定情况下,传统分类器可能更为有效,且新模型对资源的消耗较大。

(以上内容均由Ai生成)

你可能还想读

高通提前完成收购Alphawave Semi完善AI产品组合

高通提前完成收购Alphawave Semi完善AI产品组合

快速阅读: 据高通公司消息,该公司已于12月18日提前完成对Alphawave Semi的收购,以强化AI计算与连接解决方案布局;整合后将拓展数据中心等高增长市场,并由Alphawave原CEO Tony Pialis出任高通数据中心业务负 […]

发布时间:2025年12月19日
OpenAI计划募资至多1000亿美元

OpenAI计划募资至多1000亿美元

快速阅读: 据华尔街日报报道,OpenAI正筹划一轮最高达1000亿美元的融资,估值或达8300亿美元,资金将用于AI研发、算力基建及业务扩张。此轮融资被视为对其吸引长期资本能力的关键考验。 据《华尔街日报》12月19日报道,OpenAI正 […]

发布时间:2025年12月19日
埃森哲停止披露AI收入但Q1增长强劲

埃森哲停止披露AI收入但Q1增长强劲

快速阅读: 埃森哲公司在声明中表示,其2026财年一季度新订单达209亿美元,先进AI相关订单同比激增76%至22亿美元,营收达187.4亿美元并触及指引上限。公司称AI已深度融入整体业务,将不再单独披露相关数据。 埃森哲公司于近日发布20 […]

发布时间:2025年12月19日
Coursera与Udemy合并加速AI人才培养

Coursera与Udemy合并加速AI人才培养

快速阅读: 据官方透露,受人工智能快速发展影响,企业正转向模块化培训以提升员工AI技能。优达学城与Coursera合并后将构建统一技能记录系统,助力企业动态追踪并培养人才,增强应对技术变革的能力。 近日,亚马逊旗下AWS培训与认证项目董事总 […]

发布时间:2025年12月19日
微软Copilot假日广告承诺落空

微软Copilot假日广告承诺落空

快速阅读: 截至发稿时,用户反映微软Copilot在将食谱份量扩增至14人份时计算中断,并误将网页上的整数倍按钮识别为精确调节控件,最终未能输出调整后的食材清单,暴露出其在连续数值处理与界面理解方面的不足。 近日,有用户反映在使用人工智能助 […]

发布时间:2025年12月19日
谷歌Home应用支持批量迁移Nest设备

谷歌Home应用支持批量迁移Nest设备

快速阅读: 据谷歌消息,Google Home应用现已支持一次性迁移多台旧版Nest设备,涵盖恒温器、摄像头、智能门锁及烟雾报警器,大幅简化此前繁琐的手动操作流程,以加速向统一平台整合并优化用户体验。 谷歌近日在更新日志中宣布,Google […]

发布时间:2025年12月19日
美光称存储芯片短缺将持续至2026年后

美光称存储芯片短缺将持续至2026年后

快速阅读: 据官方透露,亚马逊数字广告平台在美国月活广告受众超3亿,依托Prime Video原创内容及与Netflix等平台的合作,覆盖用户全链路场景,并通过互动广告与营销云AI技术提升品牌营销精准度。 亚马逊数字广告平台(Amazon […]

发布时间:2025年12月19日
Patronus AI推出智能体训练模拟器

Patronus AI推出智能体训练模拟器

快速阅读: 据Patronus AI消息,该公司本月推出“生成式模拟器”,通过动态创建任务与实时更新规则,构建“活态”训练场以提升AI智能体的任务执行能力,并提出“开放递归自改进”机制,支持智能体在无需重训练的情况下持续优化。 人工智能领域 […]

发布时间:2025年12月19日