Meta 推出 Llama 4,先进的多模态 LLM 实现 Sota 结果
快速阅读: 据《Neowin.net》称,Meta推出Llama 4系列模型,包括探路者(170亿参数)、特立独行者(同参数但扩展专家数)及巨兽(2880亿参数)。探路者和特立独行者已开放下载并应用于多个Meta平台,Azure亦上线相关云服务。
整体而言,大型科技公司通常避免在周末发布重要公告。然而,Meta 在上个周末意外推出了其 Llama 4 系列模型。该系列包含三款模型:**Llama 4 探路者**、**Llama 4 特立独行者**和**Llama 4 巨兽**。其中,**Llama 4 探路者**是系列中体积最小的一款,拥有 170 亿活跃参数,并配备了 16 位专家。Meta 宣称,探路者是当前同类产品中表现最出色的多模态模型,在标准 AI 基准测试中超越了 **Gemma 3**、**Gemini 2.0 Flash-Lite** 和 **Mistral 3.1**。尽管性能令人赞叹,但它仍能在单一的 NVIDIA H100 GPU 上高效运行。值得一提的是,它支持行业领先的 1000 万个标记的上下文窗口,这一特性的实际效果还有待进一步验证。
**Llama 4 特立独行者**则是该系列的主流型号,同样具备 170 亿活跃参数,但扩展到了 128 位专家。Meta 表示,特立独行者是其所在类别中最佳的多模态模型,在行业基准测试中击败了广受欢迎的 **GPT-4o** 和 **Gemini 2.0 Flash**。其实验性聊天版本在 **LMArena** 平台上获得了 1417 分,位居所有领先大语言模型中的第二名。此外,Meta 还介绍了尚未完成训练的**Llama 4 巨兽**——这是整个系列中体积最大的一款,拥有 2880 亿活跃参数以及 16 位专家。据 Meta 所述,这款超大规模模型在多项标准 AI 基准测试中优于 **GPT-4.5**、**Claude Sonnet 3.7** 和 **Gemini 2.0 Pro**。
目前,**Llama 4 探路者**和**Llama 4 特立独行者**已经开放下载,用户可以从 **llama.com** 和 **Hugging Face** 获取这些模型。它们已经成功驱动了 Meta AI 在 **WhatsApp**、**Messenger**、**Instagram Direct** 和网页端的相关应用。与此同时,微软今日宣布,全新的 **Llama 4 探路者** 和 **特立独行者** 模型现已作为云服务产品在 **Azure AI 工厂** 中上线。开发者可以通过 Azure AI 工厂找到这些模型,具体名称为 **Llama-4-Scout-17B-16E**、**Llama-4-Scout-16B-16E-Instruct** 和 **Llama 4-Maverick-17B-128E-Instruct-FP8**。更多详细信息,请访问 **Azure** 官方网站。
(以上内容均由Ai生成)