Meta 推迟了“庞然大物”AI 模型;业务影响可能较小

快速阅读: 《PYMNTS.com》消息，《华尔街日报》报道，因进展不如预期，Meta推迟发布AI模型“巨兽”至秋季或更晚，影响有限，因其已有其他Llama模型可用。行业AI突破放缓，扩展定律或已达极限。

据《华尔街日报》报道，由于缺乏“显著”进展，Meta公司推迟了其名为“巨兽”（Behemoth）的人工智能模型的发布，直至秋季或更晚。这对公司的影响并不大，因为他们已经能够使用其他开源的Llama 4以及早期的人工智能模型。

全行业的AI突破速度放缓暗示扩展定律可能已接近极限。据传，Meta正将其开源Llama 4 AI模型的最大版本的发布时间从夏季推迟到最早的秋季。这款名为“巨兽”的多模态模型未能在6月前实现“显著”提升而得以发布；它原本计划在4月发布，当时Meta举办了其首次Llama开发者大会LlamaCon。

这是Meta首次在其Llama旗舰大型语言模型系列发布上遇到挫折。该系列模型因其快速发布速度而受到赞扬。作为强大的开源模型，Llama为小型公司、非营利组织及学术界的研究人员提供了一个几乎免费可用的AI模型。它是与OpenAI、谷歌、亚马逊等开发的封闭式专有模型相对立的选择。

对公司的实际影响不大，因为许多大公司通过云巨头获取服务，而这些云巨头主要提供专有模型。小型公司可以定制较小的开源Llama模型，但由于Meta作为社交媒体巨头不提供部署服务，他们仍需要帮助来实施这些模型。Meta正在利用Llama为其自己的社交媒体工具提供支持，因此首席执行官马克·扎克伯格可以掌控自己的AI命运。

据论文显示，“巨兽”的问题在于该模型是否显示出足够的进步以证明公开发布是合理的。

速度需求

在科技行业中，如果新发布的模型没有显示出足够的进步以证明公开发布合理，开发者和用户可能会迅速对其表示不满。

在LlamaCon上，Meta发布了两个较小的Llama 4姐妹模型，它们在某些方面仍然很大。Maverick总共有4000亿个参数（内部设置），上下文窗口长度为100万个标记（或75万字，GPT-4o只有12.8万个标记）。Scout有1090亿个参数，上下文窗口长度为1000万（或750万字）。最初，巨兽计划与它们同时发布，它将有2万亿个参数。

《华尔街日报》称，随着Meta继续投入巨额资金用于AI投资，Meta对其Llama 4团队感到不耐烦。今年，该公司预算高达720亿美元的资本支出，其中大部分用于支持扎克伯格的长期愿景的AI开发。

了解更多：

Meta为其Llama AI系列引入“多模态”模型

不断累积的挫败情绪

扎克伯格及其他高层尚未公布Behemoth的公开发布时间。虽然该模型仍可能比预期提前发布，甚至可能是有限形式的发布，但内部人士担忧其当前表现可能未达公司预期。

据称，Meta管理层对负责Llama 4模型团队的进展感到愈发不满，该团队在Behemoth上难以取得实质性进展。这促使公司考虑对AI产品组进行重大人事变动。

Meta对外宣传Behemoth是一个强大的系统，声称在某些评估中优于OpenAI、谷歌和Anthropic的产品。然而，知情人士表示，训练难题影响了其效果。

PYMNTS联系Meta寻求评论，但尚未收到回复。

OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月，《华尔街日报》指出其开发进度落后于计划。

OpenAI首席执行官山姆·阿尔特曼后来在2月份澄清说，过渡模型将是GPT-4.5，而GPT-5，预计带来更大进步，仍需数月时间。

OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月，《华尔街日报》指出其开发进度落后于计划。

延迟原因