埃隆·马斯克 (Elon Musk) 刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因
快速阅读: 据《VentureBeat 公司》称,xAI,由埃隆·马斯克创立的人工智能初创公司,发布了其最新模型格洛克3,声称在多项基准测试中超越了主要竞争对手。该模型在数学、科学推理和编程任务中表现出色,并将在X平台的高级订阅和新服务中提供。尽管存在一些局限性,格洛克3的发布加剧了人工智能领域的竞争。
订阅我们的每日和每周通讯,获取行业领先的人工智能覆盖的最新更新和独家内容。埃隆·马斯克的人工智能初创公司xAI发布了格洛克3,据称这是xAI最新的AI模型,在关键技术基准上超越了主要竞争对手。这一发布标志着在开发更强大AI系统竞赛中的重要进展。就在几天前马斯克以974亿美元尝试收购开放人工智能未果之后,xAI发布了格洛克3。在X平台的一次直播演示中,马斯克表示格洛克3“比格洛克2强大一个数量级”,并强调其解决复杂问题的能力。初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3在聊天机器人竞技场排行榜上以大约1400分的成绩领先,显著优于其他主要AI模型在盲测用户测试中的表现。
初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3显然具备接近最先进的思考能力,“格洛克3的推理能力接近最先进水平,”前开放人工智能研究员安德烈·卡帕西在早期访问测试后在X上写道。“很少有模型能够可靠地做到这一点。顶级的开放人工智能模型也能做到这一点,但深寻-R1、Gemini 2.0快速思考和Claude都无法做到。”
开发该模型需要大量的计算资源。xAI将其GPU集群翻倍至20万台Nvidia芯片用于训练,并安置在一个新的孟菲斯数据中心内。这种基础设施投资突显了先进AI开发对计算资源日益增长的需求,因为各家公司竞相构建更强大的系统。深度搜索和高级推理:格洛克3如何旨在超越ChatGPT和谷歌Gemini。一项关键创新是格洛克3的“深度搜索”功能,它结合了网络搜索和推理能力来分析来自多个来源的信息。该系统还包括专门模式用于复杂问题解决,包括一个展示其推理过程的“思考”功能和一个分配额外计算能力给困难任务的“大脑”模式。“在人工智能领域真正值得关注的是学习速度。而@xai的学习速度远超其他技术,”科技行业资深人士罗伯特·斯科尔布引用与苹果Siri联合创始人汤姆·格鲁伯的对话后发帖说。然而,在测试中也发现了一些局限性。卡帕西指出,该模型有时会编造引用,并且在某些类型的幽默和伦理推理任务上存在困难。这些挑战在目前的AI系统中普遍存在,突显出开发真正类人的人工智能所面临的持续难题。Scale.ai首席执行官亚历山大·王称赞了这一发布,他在推特上写道:“格洛克3是@xai团队的新世界最佳模型!”他指出了其在各种基准上的优越性能,并表达了对未来合作的热情。
人工智能领域的竞争升温:格洛克3的发布对开放人工智能、深寻和人工智能的未来意味着什么。该模型将通过X的高级订阅(每月40美元)和一个新的独立“超级格洛克”服务(每月30美元)提供。企业API访问计划在未来几周内推出。这一发布加剧了人工智能领域的竞争,特别是因为中国初创公司深寻最近展示了类似性能,据报道其所需的计算资源更少。这一发展也引发了关于人工智能军备竞赛可持续性的疑问,因为各家公司投入数十亿美元在日益强大的硬件基础设施上。在关键性能基准方面,格洛克3及其迷你版在数学、科学和编程测试中相比谷歌、开放人工智能、Anthropic和深寻的竞争模型表现更佳。全尺寸的格洛克3模型(深蓝色)在科学推理方面尤为出色。
马斯克强调,格洛克3仍处于测试阶段,预计“几乎每天都”会有改进。该公司计划在几周内增加语音交互功能,并在新版本稳定后开源之前的格洛克2模型。然而,也许格洛克3首次亮相最引人注目的方面并不是其技术规格或基准分数,而是它所代表的内容:马斯克与他在开放人工智能的前同事们之间的关系日益紧张。在他以974亿美元尝试收购开放人工智能未果后的几天内,马斯克就推出了一个挑战其主导地位的模型——这表明在人工智能主导权的高风险竞争中,即使被拒绝的追求者也可能成为强有力的对手。
每日商业应用场景洞察
如果您希望给老板留下深刻印象,VB每日可以帮到您。我们为您提供公司如何使用生成式人工智能的内部信息,帮助您分享见解以实现最大回报。立即订阅阅读我们的隐私政策感谢您的订阅。
查看更多VB新闻通讯。
(以上内容均由Ai生成)