埃隆·马斯克（Elon Musk）刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因

快速阅读: 据《VentureBeat 公司》称，xAI，由埃隆·马斯克创立的人工智能初创公司，发布了其最新模型格洛克3，声称在多项基准测试中超越了主要竞争对手。该模型在数学、科学推理和编程任务中表现出色，并将在X平台的高级订阅和新服务中提供。尽管存在一些局限性，格洛克3的发布加剧了人工智能领域的竞争。

订阅我们的每日和每周通讯，获取行业领先的人工智能覆盖的最新更新和独家内容。埃隆·马斯克的人工智能初创公司xAI发布了格洛克3，据称这是xAI最新的AI模型，在关键技术基准上超越了主要竞争对手。这一发布标志着在开发更强大AI系统竞赛中的重要进展。就在几天前马斯克以974亿美元尝试收购开放人工智能未果之后，xAI发布了格洛克3。在X平台的一次直播演示中，马斯克表示格洛克3“比格洛克2强大一个数量级”，并强调其解决复杂问题的能力。初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅，在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示，格洛克3在数学（AIME’24）、科学推理（GPQA）和编程任务中取得了优异成绩。格洛克3在聊天机器人竞技场排行榜上以大约1400分的成绩领先，显著优于其他主要AI模型在盲测用户测试中的表现。

初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅，在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示，格洛克3在数学（AIME’24）、科学推理（GPQA）和编程任务中取得了优异成绩。格洛克3显然具备接近最先进的思考能力，“格洛克3的推理能力接近最先进水平，”前开放人工智能研究员安德烈·卡帕西在早期访问测试后在X上写道。“很少有模型能够可靠地做到这一点。顶级的开放人工智能模型也能做到这一点，但深寻-R1、Gemini 2.0快速思考和Claude都无法做到。”

开发该模型需要大量的计算资源。xAI将其GPU集群翻倍至20万台Nvidia芯片用于训练，并安置在一个新的孟菲斯数据中心内。这种基础设施投资突显了先进AI开发对计算资源日益增长的需求，因为各家公司竞相构建更强大的系统。深度搜索和高级推理：格洛克3如何旨在超越ChatGPT和谷歌Gemini。一项关键创新是格洛克3的“深度搜索”功能，它结合了网络搜索和推理能力来分析来自多个来源的信息。该系统还包括专门模式用于复杂问题解决，包括一个展示其推理过程的“思考”功能和一个分配额外计算能力给困难任务的“大脑”模式。“在人工智能领域真正值得关注的是学习速度。而@xai的学习速度远超其他技术，”科技行业资深人士罗伯特·斯科尔布引用与苹果Siri联合创始人汤姆·格鲁伯的对话后发帖说。然而，在测试中也发现了一些局限性。卡帕西指出，该模型有时会编造引用，并且在某些类型的幽默和伦理推理任务上存在困难。这些挑战在目前的AI系统中普遍存在，突显出开发真正类人的人工智能所面临的持续难题。Scale.ai首席执行官亚历山大·王称赞了这一发布，他在推特上写道：“格洛克3是@xai团队的新世界最佳模型！”他指出了其在各种基准上的优越性能，并表达了对未来合作的热情。

人工智能领域的竞争升温：格洛克3的发布对开放人工智能、深寻和人工智能的未来意味着什么。该模型将通过X的高级订阅（每月40美元）和一个新的独立“超级格洛克”服务（每月30美元）提供。企业API访问计划在未来几周内推出。这一发布加剧了人工智能领域的竞争，特别是因为中国初创公司深寻最近展示了类似性能，据报道其所需的计算资源更少。这一发展也引发了关于人工智能军备竞赛可持续性的疑问，因为各家公司投入数十亿美元在日益强大的硬件基础设施上。在关键性能基准方面，格洛克3及其迷你版在数学、科学和编程测试中相比谷歌、开放人工智能、Anthropic和深寻的竞争模型表现更佳。全尺寸的格洛克3模型（深蓝色）在科学推理方面尤为出色。

马斯克强调，格洛克3仍处于测试阶段，预计“几乎每天都”会有改进。该公司计划在几周内增加语音交互功能，并在新版本稳定后开源之前的格洛克2模型。然而，也许格洛克3首次亮相最引人注目的方面并不是其技术规格或基准分数，而是它所代表的内容：马斯克与他在开放人工智能的前同事们之间的关系日益紧张。在他以974亿美元尝试收购开放人工智能未果后的几天内，马斯克就推出了一个挑战其主导地位的模型——这表明在人工智能主导权的高风险竞争中，即使被拒绝的追求者也可能成为强有力的对手。

每日商业应用场景洞察

如果您希望给老板留下深刻印象，VB每日可以帮到您。我们为您提供公司如何使用生成式人工智能的内部信息，帮助您分享见解以实现最大回报。立即订阅阅读我们的隐私政策感谢您的订阅。

查看更多VB新闻通讯。

(以上内容均由Ai生成)