OpenAI 将推出自 2019 年以来的第一个“开放重量级”模型
快速阅读: 《硅角度》消息,OpenAI计划发布首个“开放权重”模型,向开发者社区征求意见。此举旨在应对竞争压力,模型虽非完全开源,但能降低定制成本。OpenAI CEO称将严格评估模型安全性。模型预计年内推出,可能与Meta Llama及智谱V3竞争。
OpenAI正在尝试采取一种更为“开放”的策略,详细说明了其计划在今年晚些时候向开发者社区发布首个“开放权重”模型。该公司在其官网为开发者创建了反馈表格,以收集关于新模型构成的反馈,该模型仍在开发中。它正在询问开发者过去使用过哪些开放模型,以及他们希望在新的开放权重模型中看到哪些功能。在X平台上,OpenAI首席执行官山姆·阿尔特曼透露了更多细节,表示即将推出的开放模型将具备“推理”能力,类似于公司现有的o3-mini模型,后者需要时间来考虑如何回应用户的提示,从而提升其准确性。
OpenAI策略的突然转向发生在其面临众多竞争对手压力之时,这些竞争对手一直在追求更开放的人工智能开发方法。例如,中国人工智能初创公司智谱有限公司的DeepSeek R1模型是开源的,开发人员可以自由地对其进行实验和修改。然而,需要注意的是,开放权重模型并不等同于完全开源的模型。相反,它介于开源模型和闭源模型之间的中间地带。
在人工智能领域,“权重”一词指的是模型如何学习并建立连接。在它们的响应中,某些连接或特性会被赋予更大权重,以试图强化特定信息。根据美国联邦贸易委员会的定义,开放权重模型是指公开其权重并可供公众使用的模型。因此,用户将能够查看模型的权重并进行调整,这意味着他们可以通过调整权重实现模型定制,而无需在新数据上重新训练它。开放权重模型的一个优势是,开发人员调整和定制这些模型的成本更低。组织可以将内部数据上传到开放权重模型,并确保其拥有正确的权重。然后,当生成响应时,它将能够利用这些信息。这比传统模型微调要简单得多。
尽管如此,重要的是要记住,开放权重模型并非完全开源。真正的开源模型允许任何人查看其源代码、训练数据及权重。对于开放权重模型,可以看到它是如何构建连接的,但底层代码和训练数据仍然是隐藏的。也可能存在限制其使用方式的许可条款。鉴于OpenAI名不副实——它是最保密的人工智能公司之一,例如不披露ChatGPT的训练数据——开放权重模型不太可能揭示太多秘密。不过,OpenAI显然认为采取更开放的方法是必要的。这家今天获得400亿美元新融资的公司正与竞争对手展开激烈的竞争,后者正在争先恐后地开发新型人工智能模型。开放权重模型可能会与Meta平台公司的Llama家族竞争,后者也被宣传为开源,尽管它们也不符合传统定义。智谱是另一个竞争对手,其最新的V3模型目前被认为是功能最强大的开放权重模型之一。这对OpenAI构成威胁,因为它不仅匹配甚至有时超越其最佳专有模型的能力,而且对企业和开发者来说也便宜得多,易于定制。
OpenAI没有说明其预计何时推出新的开放权重模型,这是自2019年2月推出GPT-2以来的首个此类模型。在X平台上,阿尔特曼在文章中解释道:“公司需要依据其‘准备框架’评估新模型,就像对其任何专有模型一样。‘由于我们知道这个模型将在发布后被调整……我们将进行额外的工作。我们很兴奋看到开发人员会构建什么,以及大型公司和政府如何使用它,在他们更愿意自行部署模型的情况下。’”
图片:SiliconANGLE/Meta AI
来自SiliconANGLE联合创始人约翰·弗瑞尔的信息:您的支持对我们很重要,它帮助我们保持内容免费。只需点击一下即可支持我们的使命,即提供免费、深入且相关的内容。加入我们的YouTube社区加入包括超过15,000名#CubeAlumni专家的社区,其中包括亚马逊首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·格尔辛格等众多名人和专家。
“CUBE是行业的重要合作伙伴。你们真的是我们活动的一部分,我们非常感谢你们的到来,我知道人们也很欣赏你们创造的内容。”——安迪·贾西
(以上内容均由Ai生成)