Meta 推迟了“庞然大物”AI 模型;业务影响可能较小

发布时间:2025年5月16日    来源:szf
Meta 推迟了“庞然大物”AI 模型;业务影响可能较小

快速阅读: 《PYMNTS.com》消息,《华尔街日报》报道,因进展不如预期,Meta推迟发布AI模型“巨兽”至秋季或更晚,影响有限,因其已有其他Llama模型可用。行业AI突破放缓,扩展定律或已达极限。

据《华尔街日报》报道,由于缺乏“显著”进展,Meta公司推迟了其名为“巨兽”(Behemoth)的人工智能模型的发布,直至秋季或更晚。这对公司的影响并不大,因为他们已经能够使用其他开源的Llama 4以及早期的人工智能模型。

全行业的AI突破速度放缓暗示扩展定律可能已接近极限。据传,Meta正将其开源Llama 4 AI模型的最大版本的发布时间从夏季推迟到最早的秋季。这款名为“巨兽”的多模态模型未能在6月前实现“显著”提升而得以发布;它原本计划在4月发布,当时Meta举办了其首次Llama开发者大会LlamaCon。

这是Meta首次在其Llama旗舰大型语言模型系列发布上遇到挫折。该系列模型因其快速发布速度而受到赞扬。作为强大的开源模型,Llama为小型公司、非营利组织及学术界的研究人员提供了一个几乎免费可用的AI模型。它是与OpenAI、谷歌、亚马逊等开发的封闭式专有模型相对立的选择。

对公司的实际影响不大,因为许多大公司通过云巨头获取服务,而这些云巨头主要提供专有模型。小型公司可以定制较小的开源Llama模型,但由于Meta作为社交媒体巨头不提供部署服务,他们仍需要帮助来实施这些模型。Meta正在利用Llama为其自己的社交媒体工具提供支持,因此首席执行官马克·扎克伯格可以掌控自己的AI命运。

据论文显示,“巨兽”的问题在于该模型是否显示出足够的进步以证明公开发布是合理的。

速度需求

在科技行业中,如果新发布的模型没有显示出足够的进步以证明公开发布合理,开发者和用户可能会迅速对其表示不满。

在LlamaCon上,Meta发布了两个较小的Llama 4姐妹模型,它们在某些方面仍然很大。Maverick总共有4000亿个参数(内部设置),上下文窗口长度为100万个标记(或75万字,GPT-4o只有12.8万个标记)。Scout有1090亿个参数,上下文窗口长度为1000万(或750万字)。最初,巨兽计划与它们同时发布,它将有2万亿个参数。

《华尔街日报》称,随着Meta继续投入巨额资金用于AI投资,Meta对其Llama 4团队感到不耐烦。今年,该公司预算高达720亿美元的资本支出,其中大部分用于支持扎克伯格的长期愿景的AI开发。

了解更多:

Meta为其Llama AI系列引入“多模态”模型

不断累积的挫败情绪

扎克伯格及其他高层尚未公布Behemoth的公开发布时间。虽然该模型仍可能比预期提前发布,甚至可能是有限形式的发布,但内部人士担忧其当前表现可能未达公司预期。

据称,Meta管理层对负责Llama 4模型团队的进展感到愈发不满,该团队在Behemoth上难以取得实质性进展。这促使公司考虑对AI产品组进行重大人事变动。

Meta对外宣传Behemoth是一个强大的系统,声称在某些评估中优于OpenAI、谷歌和Anthropic的产品。然而,知情人士表示,训练难题影响了其效果。

PYMNTS联系Meta寻求评论,但尚未收到回复。

OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月,《华尔街日报》指出其开发进度落后于计划。

OpenAI首席执行官山姆·阿尔特曼后来在2月份澄清说,过渡模型将是GPT-4.5,而GPT-5,预计带来更大进步,仍需数月时间。

OpenAI也遭遇了延迟。其下一个主要模型GPT-5原计划于2024年中期发布。去年12月,《华尔街日报》指出其开发进度落后于计划。

延迟原因

AI模型开发的进步可能因多种原因放缓。其中包括:

高质量数据耗尽

大型语言模型需要海量的数据进行训练,例如整个互联网。但它们可能已经用尽可公开获取的数据,而版权内容则存在法律风险。

这就是为什么OpenAI、谷歌和微软敦促特朗普政府保留其使用版权材料进行训练的权利。

“联邦政府既可以保障美国人从AI学习的自由,又可以通过保护美国AI模型学习版权材料的能力避免失去我们的AI领先地位给中华人民共和国(PRC),”OpenAI表示。

算法限制

过去,增加模型规模、使用更多计算资源并让模型在更多数据上训练会带来显著进步。

但根据彭博社报道,AI模型的回报正在递减,一些人认为扩展定律正在放缓。

推荐

Meta推迟“Behemoth”AI模型;商业影响可能较小

FTX将在第二次分配中向债权人分发50亿美元

Dick’s Sporting Goods收购Foot Locker并拓展国际市场

报告:Meta因性能问题推迟推出Behemoth AI模型

更多信息请参见:

人工智能、Anthropic、人工智能、Behemoth、GenAI、生成式AI、大型语言模型、LLAMA、LLMs、马克·扎克伯格、Maverick、Meta、新闻、OpenAI、PYMNTS新闻、Scout

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日