OpenAI 将推出自 2019 年以来的第一个“开放重量级”模型

快速阅读: 《硅角度》消息，OpenAI计划发布首个“开放权重”模型，向开发者社区征求意见。此举旨在应对竞争压力，模型虽非完全开源，但能降低定制成本。OpenAI CEO称将严格评估模型安全性。模型预计年内推出，可能与Meta Llama及智谱V3竞争。

OpenAI正在尝试采取一种更为“开放”的策略，详细说明了其计划在今年晚些时候向开发者社区发布首个“开放权重”模型。该公司在其官网为开发者创建了反馈表格，以收集关于新模型构成的反馈，该模型仍在开发中。它正在询问开发者过去使用过哪些开放模型，以及他们希望在新的开放权重模型中看到哪些功能。在X平台上，OpenAI首席执行官山姆·阿尔特曼透露了更多细节，表示即将推出的开放模型将具备“推理”能力，类似于公司现有的o3-mini模型，后者需要时间来考虑如何回应用户的提示，从而提升其准确性。

OpenAI策略的突然转向发生在其面临众多竞争对手压力之时，这些竞争对手一直在追求更开放的人工智能开发方法。例如，中国人工智能初创公司智谱有限公司的DeepSeek R1模型是开源的，开发人员可以自由地对其进行实验和修改。然而，需要注意的是，开放权重模型并不等同于完全开源的模型。相反，它介于开源模型和闭源模型之间的中间地带。

在人工智能领域，“权重”一词指的是模型如何学习并建立连接。在它们的响应中，某些连接或特性会被赋予更大权重，以试图强化特定信息。根据美国联邦贸易委员会的定义，开放权重模型是指公开其权重并可供公众使用的模型。因此，用户将能够查看模型的权重并进行调整，这意味着他们可以通过调整权重实现模型定制，而无需在新数据上重新训练它。开放权重模型的一个优势是，开发人员调整和定制这些模型的成本更低。组织可以将内部数据上传到开放权重模型，并确保其拥有正确的权重。然后，当生成响应时，它将能够利用这些信息。这比传统模型微调要简单得多。

尽管如此，重要的是要记住，开放权重模型并非完全开源。真正的开源模型允许任何人查看其源代码、训练数据及权重。对于开放权重模型，可以看到它是如何构建连接的，但底层代码和训练数据仍然是隐藏的。也可能存在限制其使用方式的许可条款。鉴于OpenAI名不副实——它是最保密的人工智能公司之一，例如不披露ChatGPT的训练数据——开放权重模型不太可能揭示太多秘密。不过，OpenAI显然认为采取更开放的方法是必要的。这家今天获得400亿美元新融资的公司正与竞争对手展开激烈的竞争，后者正在争先恐后地开发新型人工智能模型。开放权重模型可能会与Meta平台公司的Llama家族竞争，后者也被宣传为开源，尽管它们也不符合传统定义。智谱是另一个竞争对手，其最新的V3模型目前被认为是功能最强大的开放权重模型之一。这对OpenAI构成威胁，因为它不仅匹配甚至有时超越其最佳专有模型的能力，而且对企业和开发者来说也便宜得多，易于定制。

OpenAI没有说明其预计何时推出新的开放权重模型，这是自2019年2月推出GPT-2以来的首个此类模型。在X平台上，阿尔特曼在文章中解释道：“公司需要依据其‘准备框架’评估新模型，就像对其任何专有模型一样。‘由于我们知道这个模型将在发布后被调整……我们将进行额外的工作。我们很兴奋看到开发人员会构建什么，以及大型公司和政府如何使用它，在他们更愿意自行部署模型的情况下。’”

图片：SiliconANGLE/Meta AI

来自SiliconANGLE联合创始人约翰·弗瑞尔的信息：您的支持对我们很重要，它帮助我们保持内容免费。只需点击一下即可支持我们的使命，即提供免费、深入且相关的内容。加入我们的YouTube社区加入包括超过15,000名#CubeAlumni专家的社区，其中包括亚马逊首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·格尔辛格等众多名人和专家。

“CUBE是行业的重要合作伙伴。你们真的是我们活动的一部分，我们非常感谢你们的到来，我知道人们也很欣赏你们创造的内容。”——安迪·贾西

(以上内容均由Ai生成)