埃隆·马斯克 (Elon Musk) 刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因

发布时间:2025年2月19日    来源:szf
埃隆·马斯克 (Elon Musk) 刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因

快速阅读: 据《VentureBeat 公司》称,xAI,由埃隆·马斯克创立的人工智能初创公司,发布了其最新模型格洛克3,声称在多项基准测试中超越了主要竞争对手。该模型在数学、科学推理和编程任务中表现出色,并将在X平台的高级订阅和新服务中提供。尽管存在一些局限性,格洛克3的发布加剧了人工智能领域的竞争。

订阅我们的每日和每周通讯,获取行业领先的人工智能覆盖的最新更新和独家内容。埃隆·马斯克的人工智能初创公司xAI发布了格洛克3,据称这是xAI最新的AI模型,在关键技术基准上超越了主要竞争对手。这一发布标志着在开发更强大AI系统竞赛中的重要进展。就在几天前马斯克以974亿美元尝试收购开放人工智能未果之后,xAI发布了格洛克3。在X平台的一次直播演示中,马斯克表示格洛克3“比格洛克2强大一个数量级”,并强调其解决复杂问题的能力。初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3在聊天机器人竞技场排行榜上以大约1400分的成绩领先,显著优于其他主要AI模型在盲测用户测试中的表现。

初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3显然具备接近最先进的思考能力,“格洛克3的推理能力接近最先进水平,”前开放人工智能研究员安德烈·卡帕西在早期访问测试后在X上写道。“很少有模型能够可靠地做到这一点。顶级的开放人工智能模型也能做到这一点,但深寻-R1、Gemini 2.0快速思考和Claude都无法做到。”

开发该模型需要大量的计算资源。xAI将其GPU集群翻倍至20万台Nvidia芯片用于训练,并安置在一个新的孟菲斯数据中心内。这种基础设施投资突显了先进AI开发对计算资源日益增长的需求,因为各家公司竞相构建更强大的系统。深度搜索和高级推理:格洛克3如何旨在超越ChatGPT和谷歌Gemini。一项关键创新是格洛克3的“深度搜索”功能,它结合了网络搜索和推理能力来分析来自多个来源的信息。该系统还包括专门模式用于复杂问题解决,包括一个展示其推理过程的“思考”功能和一个分配额外计算能力给困难任务的“大脑”模式。“在人工智能领域真正值得关注的是学习速度。而@xai的学习速度远超其他技术,”科技行业资深人士罗伯特·斯科尔布引用与苹果Siri联合创始人汤姆·格鲁伯的对话后发帖说。然而,在测试中也发现了一些局限性。卡帕西指出,该模型有时会编造引用,并且在某些类型的幽默和伦理推理任务上存在困难。这些挑战在目前的AI系统中普遍存在,突显出开发真正类人的人工智能所面临的持续难题。Scale.ai首席执行官亚历山大·王称赞了这一发布,他在推特上写道:“格洛克3是@xai团队的新世界最佳模型!”他指出了其在各种基准上的优越性能,并表达了对未来合作的热情。

人工智能领域的竞争升温:格洛克3的发布对开放人工智能、深寻和人工智能的未来意味着什么。该模型将通过X的高级订阅(每月40美元)和一个新的独立“超级格洛克”服务(每月30美元)提供。企业API访问计划在未来几周内推出。这一发布加剧了人工智能领域的竞争,特别是因为中国初创公司深寻最近展示了类似性能,据报道其所需的计算资源更少。这一发展也引发了关于人工智能军备竞赛可持续性的疑问,因为各家公司投入数十亿美元在日益强大的硬件基础设施上。在关键性能基准方面,格洛克3及其迷你版在数学、科学和编程测试中相比谷歌、开放人工智能、Anthropic和深寻的竞争模型表现更佳。全尺寸的格洛克3模型(深蓝色)在科学推理方面尤为出色。

马斯克强调,格洛克3仍处于测试阶段,预计“几乎每天都”会有改进。该公司计划在几周内增加语音交互功能,并在新版本稳定后开源之前的格洛克2模型。然而,也许格洛克3首次亮相最引人注目的方面并不是其技术规格或基准分数,而是它所代表的内容:马斯克与他在开放人工智能的前同事们之间的关系日益紧张。在他以974亿美元尝试收购开放人工智能未果后的几天内,马斯克就推出了一个挑战其主导地位的模型——这表明在人工智能主导权的高风险竞争中,即使被拒绝的追求者也可能成为强有力的对手。

每日商业应用场景洞察

如果您希望给老板留下深刻印象,VB每日可以帮到您。我们为您提供公司如何使用生成式人工智能的内部信息,帮助您分享见解以实现最大回报。立即订阅阅读我们的隐私政策感谢您的订阅。

查看更多VB新闻通讯。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日