OpenAI 发布新模型,支持自定义安全政策分类

发布时间:2025年10月30日    来源:szf
OpenAI 发布新模型,支持自定义安全政策分类

快速阅读: OpenAI发布gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款新模型,支持自定义安全政策进行推理分类,适用于多种安全场景,但资源消耗较大。

近日,OpenAI 发布了两款新型开放式权重模型,分别是 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,专注于 AI 安全领域的应用。这些模型在之前的 gpt-oss 系列基础上进行了优化,继续遵循 Apache 2.0 许可证,允许任何人自由使用、修改和部署。

新模型的一大亮点在于,它们为开发者提供了根据自定义安全政策进行推理分类的能力,突破了传统的“一刀切”安全系统。开发者可以在推理时输入自己的安全政策和待检测内容,模型会根据这些政策进行分类,并提供相应的推理依据。安全政策可以根据需要灵活调整,以提升模型的表现。这使得 gpt-oss-safeguard 模型能够对用户消息、聊天回复乃至完整对话进行分类,满足不同需求。

OpenAI 指出,这种新模型尤其适用于以下几种特定情境:当潜在威胁正在出现或变化时,安全政策需要迅速适应;在某些高度专业化领域,传统的小型分类器难以有效应对;以及在开发者缺乏大量高质量样本时,难以训练出高效的分类器。此外,对于那些希望在分类结果的质量和可解释性上优先于处理速度的场景,这些新模型也是一个理想的选择。

然而,gpt-oss-safeguard 也存在一定的局限性。OpenAI 提到,如果平台拥有大量标注样本并能训练传统分类器,在复杂或高风险的场景中,传统分类器可能仍表现出更好的性能,定制化模型的精度更高。同时,新模型在处理速度和资源消耗方面较大,因此不太适合用于大规模的实时内容审查。

目前,gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 已经可以在 Hugging Face 平台上免费下载,方便广大开发者进行探索和应用。链接如下:https://huggingface.co/collections/openai/gpt-oss-safeguard

要点总结:

– 🛡️ OpenAI 推出了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款新型安全模型,支持灵活自定义安全政策。

– ⚙️ 新模型可根据输入的安全政策对用户消息和对话进行分类,并提供推理依据。

– 📊 尽管新模型具有优势,但在某些情况下,传统分类器可能更有效,且新模型资源消耗较大。

(以上内容均由Ai生成)

你可能还想读

HackerOne双高管加盟加速企业市场拓展

HackerOne双高管加盟加速企业市场拓展

快速阅读: 据HackerOne消息,该公司近日任命Stephanie Furfaro为首席营收官、Stacy Leidwinger为首席营销官,旨在强化全球市场拓展与AI驱动的威胁暴露管理能力,推动CTEM解决方案落地。 网络安全企业Ha […]

发布时间:2025年12月16日
习惯决定AI落地成败

习惯决定AI落地成败

快速阅读: 据国际法律技术协会消息,2025年技术调查显示80%法律团队已采用生成式AI,当前重点在于平衡技术工具与以人为本的实施策略,以应对智能体AI时代的工作转型挑战。 据国际法律技术协会(ILTA)2025年技术调查报告显示,80%的 […]

发布时间:2025年12月16日
旧AI芯片将何去何从?

旧AI芯片将何去何从?

快速阅读: 截至发稿时,2026年5月19日至20日,财富职场创新峰会将在亚特兰大举行,聚焦人工智能与人文战略融合重塑未来工作模式,全球创新领袖将共议技术赋能、人才发展及组织变革新趋势。 2026年5月19日至20日,财富职场创新峰会将在亚 […]

发布时间:2025年12月16日
新闻机构面临AI转型关键抉择

新闻机构面临AI转型关键抉择

快速阅读: 据行业人士表示,新闻机构面临AI时代关键抉择:若继续屏蔽爬虫将丧失信息分发主导权,专家建议中小媒体联合开发标准化API,主动开放内容并嵌入AI服务,以在智能化转型中争取品牌曝光与合作机会。 2026年,新闻机构将面临人工智能(A […]

发布时间:2025年12月16日
AI智能眼镜爆发式增长引发合规担忧

AI智能眼镜爆发式增长引发合规担忧

快速阅读: 据权威渠道透露,AI眼镜加速企业落地,2024年全球出货量激增210%,但其生物识别数据收集功能引发BIPA、GDPR等合规风险,企业需加强隐私评估、员工培训及法律协议以规避高额赔偿与声誉损失。 人工智能眼镜已从未来概念逐步走入 […]

发布时间:2025年12月16日
St. Jude推出AI平台加速药物组合发现

St. Jude推出AI平台加速药物组合发现

快速阅读: 据圣裘德儿童研究医院消息,其科学家近日开发出名为Combocat的药物组合筛选平台,融合机器学习与声波液体处理技术,显著提升新药组合发现效率并降低试剂消耗,已成功在神经母细胞瘤研究中验证效果,平台现已开源免费供全球科研使用。 美 […]

发布时间:2025年12月16日
企业AI落地依赖合作伙伴生态

企业AI落地依赖合作伙伴生态

快速阅读: 据SiliconANGLE Media报道,Cloudera联合英伟达推出企业级AI生态系统,集成NIM微服务与高可用架构,将部署周期从六个月缩短至数周,并指出2025年“智能体工作流”将迈入生产应用关键阶段。 随着人工智能从实 […]

发布时间:2025年12月16日
千美元内可投的AI指数基金首选

千美元内可投的AI指数基金首选

快速阅读: 据权威消息,景顺QQQ信托作为跟踪纳斯达克100指数的代表性AI主题基金,汇聚多家领先科技企业,为投资者提供分散风险、便捷参与人工智能产业发展的高流动性配置工具。 投资者无需自行挑选人工智能领域的个股,大型投资机构已推出相关产品 […]

发布时间:2025年12月16日