OpenAI 发布新模型,支持自定义安全政策分类

发布时间:2025年10月30日    来源:szf
OpenAI 发布新模型,支持自定义安全政策分类

快速阅读: OpenAI发布gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款新模型,支持自定义安全政策进行推理分类,适用于多种安全场景,但资源消耗较大。

近日,OpenAI 发布了两款新型开放式权重模型,分别是 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b,专注于 AI 安全领域的应用。这些模型在之前的 gpt-oss 系列基础上进行了优化,继续遵循 Apache 2.0 许可证,允许任何人自由使用、修改和部署。

新模型的一大亮点在于,它们为开发者提供了根据自定义安全政策进行推理分类的能力,突破了传统的“一刀切”安全系统。开发者可以在推理时输入自己的安全政策和待检测内容,模型会根据这些政策进行分类,并提供相应的推理依据。安全政策可以根据需要灵活调整,以提升模型的表现。这使得 gpt-oss-safeguard 模型能够对用户消息、聊天回复乃至完整对话进行分类,满足不同需求。

OpenAI 指出,这种新模型尤其适用于以下几种特定情境:当潜在威胁正在出现或变化时,安全政策需要迅速适应;在某些高度专业化领域,传统的小型分类器难以有效应对;以及在开发者缺乏大量高质量样本时,难以训练出高效的分类器。此外,对于那些希望在分类结果的质量和可解释性上优先于处理速度的场景,这些新模型也是一个理想的选择。

然而,gpt-oss-safeguard 也存在一定的局限性。OpenAI 提到,如果平台拥有大量标注样本并能训练传统分类器,在复杂或高风险的场景中,传统分类器可能仍表现出更好的性能,定制化模型的精度更高。同时,新模型在处理速度和资源消耗方面较大,因此不太适合用于大规模的实时内容审查。

目前,gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 已经可以在 Hugging Face 平台上免费下载,方便广大开发者进行探索和应用。链接如下:https://huggingface.co/collections/openai/gpt-oss-safeguard

要点总结:

– 🛡️ OpenAI 推出了 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款新型安全模型,支持灵活自定义安全政策。

– ⚙️ 新模型可根据输入的安全政策对用户消息和对话进行分类,并提供推理依据。

– 📊 尽管新模型具有优势,但在某些情况下,传统分类器可能更有效,且新模型资源消耗较大。

(以上内容均由Ai生成)

你可能还想读

科技巨头财报夜:Meta巨资押注AI遭市场质疑,Alphabet与微软表现稳健

科技巨头财报夜:Meta巨资押注AI遭市场质疑,Alphabet与微软表现稳健

快速阅读: 纽约盘后交易,Alphabet财报超预期股价上涨,微软稳健财报未达高期待股价微跌,Meta加大AI投资致股价大跌,市值蒸发超1550亿美元。 纽约盘后交易时段的活跃表现揭示了明显的市场偏好。Alphabet轻松超越预期并获得奖励 […]

发布时间:2025年10月31日
律师探讨AI与商业秘密风险

律师探讨AI与商业秘密风险

快速阅读: 主持人Tina和Jennie与律师Michael Parente讨论AI工具在工作中的使用增加带来的法律风险,包括虚假索赔、内部威胁和商业秘密盗窃,特别是在政府合同环境下的挑战。 在本期节目中,主持人Tina和Jennie邀请了 […]

发布时间:2025年10月31日
微软Copilot新功能:安全沙箱助力深度研究

微软Copilot新功能:安全沙箱助力深度研究

快速阅读: 微软365 Copilot更新推出“研究员计算机使用”,利用Windows 11 Pro沙箱技术,提升AI深度研究能力,增强安全性与用户互动,性能显著提升44%。 微软 Copilot 正利用 Windows 11 Pro 的一 […]

发布时间:2025年10月31日
新型AI浏览器技术被用于传播虚假内容,引发信息安全新挑战

新型AI浏览器技术被用于传播虚假内容,引发信息安全新挑战

快速阅读: 新型隐身技术利用AI浏览器如ChatGPT Atlas传递误导信息,通过篡改网页内容影响AI决策,对招聘、商业及声誉管理构成威胁,需加强数据源验证和监控。 一种新的针对代理的隐身技术利用了像OpenAI的ChatGPT Atla […]

发布时间:2025年10月31日
24HR卡车服务推出AI驱动的重型车辆救援平台

24HR卡车服务推出AI驱动的重型车辆救援平台

快速阅读: 24HR Truck Services推出新一代AI支持的路边援助平台,专为保险公司及房车、重型卡车客户提供更快捷、可靠的服务,同时降低成本。 特拉华州威尔明顿,2025年10月30日 — 全国领先的卡车服务公司24HR Tru […]

发布时间:2025年10月31日
研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

研究发现:对ChatGPT粗鲁可提高准确性,但后果堪忧

快速阅读: 宾夕法尼亚州立大学研究显示,对AI不礼貌的提示能提高其准确性,但可能损害用户体验和沟通规范,研究强调了人机交互的复杂性。 研究人员表示,对AI下属采取强硬态度可能比礼貌更有效,但这并不意味着长期而言,粗鲁的态度不会带来后果。宾夕 […]

发布时间:2025年10月31日
英伟达与Flex合作打造大规模AI工厂

英伟达与Flex合作打造大规模AI工厂

快速阅读: 英伟达与Flex合作开发高性能、高能效的AI工厂,利用Flex的制造能力和全球布局,开发模块化数据中心系统,满足美国AI基础设施需求,采用英伟达cuOpt优化引擎提升规划和流程效率。 英伟达与制造开发商Flex合作开发大规模AI […]

发布时间:2025年10月31日
谷歌推出Android新AI功能,助力开发者构建智能应用

谷歌推出Android新AI功能,助力开发者构建智能应用

快速阅读: 谷歌安卓部门发布多个人工智能新功能,包括Google Nano微型模型,增强设备端AI能力,支持图像生成和Android Studio“氛围编码”功能更新。新功能提升开发者效率,加强安全性和隐私保护。 谷歌旗下的安卓部门今日宣布 […]

发布时间:2025年10月31日