Meta 推迟了“庞然大物”AI 模型;业务影响可能较小
快速阅读: 《PYMNTS.com》消息,《华尔街日报》报道,因进展不如预期,Meta推迟发布AI模型“巨兽”至秋季或更晚,影响有限,因其已有其他Llama模型可用。行业AI突破放缓,扩展定律或已达极限。
据《华尔街日报》报道,由于缺乏“显著”进展,Meta公司推迟了其名为“巨兽”(Behemoth)的人工智能模型的发布,直至秋季或更晚。这对公司的影响并不大,因为他们已经能够使用其他开源的Llama 4以及早期的人工智能模型。
全行业的AI突破速度放缓暗示扩展定律可能已接近极限。据传,Meta正将其开源Llama 4 AI模型的最大版本的发布时间从夏季推迟到最早的秋季。这款名为“巨兽”的多模态模型未能在6月前实现“显著”提升而得以发布;它原本计划在4月发布,当时Meta举办了其首次Llama开发者大会LlamaCon。
这是Meta首次在其Llama旗舰大型语言模型系列发布上遇到挫折。该系列模型因其快速发布速度而受到赞扬。作为强大的开源模型,Llama为小型公司、非营利组织及学术界的研究人员提供了一个几乎免费可用的AI模型。它是与OpenAI、谷歌、亚马逊等开发的封闭式专有模型相对立的选择。
对公司的实际影响不大,因为许多大公司通过云巨头获取服务,而这些云巨头主要提供专有模型。小型公司可以定制较小的开源Llama模型,但由于Meta作为社交媒体巨头不提供部署服务,他们仍需要帮助来实施这些模型。Meta正在利用Llama为其自己的社交媒体工具提供支持,因此首席执行官马克·扎克伯格可以掌控自己的AI命运。
据论文显示,“巨兽”的问题在于该模型是否显示出足够的进步以证明公开发布是合理的。
速度需求
在科技行业中,如果新发布的模型没有显示出足够的进步以证明公开发布合理,开发者和用户可能会迅速对其表示不满。
在LlamaCon上,Meta发布了两个较小的Llama 4姐妹模型,它们在某些方面仍然很大。Maverick总共有4000亿个参数(内部设置),上下文窗口长度为100万个标记(或75万字,GPT-4o只有12.8万个标记)。Scout有1090亿个参数,上下文窗口长度为1000万(或750万字)。最初,巨兽计划与它们同时发布,它将有2万亿个参数。
《华尔街日报》称,随着Meta继续投入巨额资金用于AI投资,Meta对其Llama 4团队感到不耐烦。今年,该公司预算高达720亿美元的资本支出,其中大部分用于支持扎克伯格的长期愿景的AI开发。
了解更多:
Meta为其Llama AI系列引入“多模态”模型
不断累积的挫败情绪
扎克伯格及其他高层尚未公布Behemoth的公开发布时间。虽然该模型仍可能比预期提前发布,甚至可能是有限形式的发布,但内部人士担忧其当前表现可能未达公司预期。
据称,Meta管理层对负责Llama 4模型团队的进展感到愈发不满,该团队在Behemoth上难以取得实质性进展。这促使公司考虑对AI产品组进行重大人事变动。
Meta对外宣传Behemoth是一个强大的系统,声称在某些评估中优于OpenAI、谷歌和Anthropic的产品。然而,知情人士表示,训练难题影响了其效果。
PYMNTS联系Meta寻求评论,但尚未收到回复。
OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月,《华尔街日报》指出其开发进度落后于计划。
OpenAI首席执行官山姆·阿尔特曼后来在2月份澄清说,过渡模型将是GPT-4.5,而GPT-5,预计带来更大进步,仍需数月时间。
OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月,《华尔街日报》指出其开发进度落后于计划。
延迟原因
AI模型开发的进步可能因多种原因放缓。其中包括:
高质量数据耗尽
大型语言模型需要海量的数据进行训练,例如整个互联网。但它们可能已经用尽可公开获取的数据,而版权内容则存在法律风险。
这就是为什么OpenAI、谷歌和微软敦促特朗普政府保留其使用版权材料进行训练的权利。
“联邦政府既可以保障美国人从AI学习的自由,又可以通过保护美国AI模型学习版权材料的能力避免失去我们的AI领先地位给中华人民共和国(PRC),”OpenAI表示。
算法限制
过去,增加模型规模、使用更多计算资源并让模型在更多数据上训练会带来显著进步。
但根据彭博社报道,AI模型的回报正在递减,一些人认为扩展定律正在放缓。
推荐
Meta推迟“Behemoth”AI模型;商业影响可能较小
FTX将在第二次分配中向债权人分发50亿美元
Dick’s Sporting Goods收购Foot Locker并拓展国际市场
报告:Meta因性能问题推迟推出Behemoth AI模型
更多信息请参见:
人工智能、Anthropic、人工智能、Behemoth、GenAI、生成式AI、大型语言模型、LLAMA、LLMs、马克·扎克伯格、Maverick、Meta、新闻、OpenAI、PYMNTS新闻、Scout
(以上内容均由Ai生成)