OpenAI 将推出自 2019 年以来的第一个“开放重量级”模型

发布时间:2025年4月1日    来源:szf
OpenAI 将推出自 2019 年以来的第一个“开放重量级”模型

快速阅读: 《硅角度》消息,OpenAI计划发布首个“开放权重”模型,向开发者社区征求意见。此举旨在应对竞争压力,模型虽非完全开源,但能降低定制成本。OpenAI CEO称将严格评估模型安全性。模型预计年内推出,可能与Meta Llama及智谱V3竞争。

OpenAI正在尝试采取一种更为“开放”的策略,详细说明了其计划在今年晚些时候向开发者社区发布首个“开放权重”模型。该公司在其官网为开发者创建了反馈表格,以收集关于新模型构成的反馈,该模型仍在开发中。它正在询问开发者过去使用过哪些开放模型,以及他们希望在新的开放权重模型中看到哪些功能。在X平台上,OpenAI首席执行官山姆·阿尔特曼透露了更多细节,表示即将推出的开放模型将具备“推理”能力,类似于公司现有的o3-mini模型,后者需要时间来考虑如何回应用户的提示,从而提升其准确性。

OpenAI策略的突然转向发生在其面临众多竞争对手压力之时,这些竞争对手一直在追求更开放的人工智能开发方法。例如,中国人工智能初创公司智谱有限公司的DeepSeek R1模型是开源的,开发人员可以自由地对其进行实验和修改。然而,需要注意的是,开放权重模型并不等同于完全开源的模型。相反,它介于开源模型和闭源模型之间的中间地带。

在人工智能领域,“权重”一词指的是模型如何学习并建立连接。在它们的响应中,某些连接或特性会被赋予更大权重,以试图强化特定信息。根据美国联邦贸易委员会的定义,开放权重模型是指公开其权重并可供公众使用的模型。因此,用户将能够查看模型的权重并进行调整,这意味着他们可以通过调整权重实现模型定制,而无需在新数据上重新训练它。开放权重模型的一个优势是,开发人员调整和定制这些模型的成本更低。组织可以将内部数据上传到开放权重模型,并确保其拥有正确的权重。然后,当生成响应时,它将能够利用这些信息。这比传统模型微调要简单得多。

尽管如此,重要的是要记住,开放权重模型并非完全开源。真正的开源模型允许任何人查看其源代码、训练数据及权重。对于开放权重模型,可以看到它是如何构建连接的,但底层代码和训练数据仍然是隐藏的。也可能存在限制其使用方式的许可条款。鉴于OpenAI名不副实——它是最保密的人工智能公司之一,例如不披露ChatGPT的训练数据——开放权重模型不太可能揭示太多秘密。不过,OpenAI显然认为采取更开放的方法是必要的。这家今天获得400亿美元新融资的公司正与竞争对手展开激烈的竞争,后者正在争先恐后地开发新型人工智能模型。开放权重模型可能会与Meta平台公司的Llama家族竞争,后者也被宣传为开源,尽管它们也不符合传统定义。智谱是另一个竞争对手,其最新的V3模型目前被认为是功能最强大的开放权重模型之一。这对OpenAI构成威胁,因为它不仅匹配甚至有时超越其最佳专有模型的能力,而且对企业和开发者来说也便宜得多,易于定制。

OpenAI没有说明其预计何时推出新的开放权重模型,这是自2019年2月推出GPT-2以来的首个此类模型。在X平台上,阿尔特曼在文章中解释道:“公司需要依据其‘准备框架’评估新模型,就像对其任何专有模型一样。‘由于我们知道这个模型将在发布后被调整……我们将进行额外的工作。我们很兴奋看到开发人员会构建什么,以及大型公司和政府如何使用它,在他们更愿意自行部署模型的情况下。’”

图片:SiliconANGLE/Meta AI

来自SiliconANGLE联合创始人约翰·弗瑞尔的信息:您的支持对我们很重要,它帮助我们保持内容免费。只需点击一下即可支持我们的使命,即提供免费、深入且相关的内容。加入我们的YouTube社区加入包括超过15,000名#CubeAlumni专家的社区,其中包括亚马逊首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·格尔辛格等众多名人和专家。

“CUBE是行业的重要合作伙伴。你们真的是我们活动的一部分,我们非常感谢你们的到来,我知道人们也很欣赏你们创造的内容。”——安迪·贾西

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日