埃隆·马斯克 (Elon Musk) 刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因

发布时间:2025年2月19日    来源:szf
埃隆·马斯克 (Elon Musk) 刚刚发布了一款比 ChatGPT 更智能的 AI——这就是它很重要的原因

快速阅读: 据《VentureBeat 公司》称,xAI,由埃隆·马斯克创立的人工智能初创公司,发布了其最新模型格洛克3,声称在多项基准测试中超越了主要竞争对手。该模型在数学、科学推理和编程任务中表现出色,并将在X平台的高级订阅和新服务中提供。尽管存在一些局限性,格洛克3的发布加剧了人工智能领域的竞争。

订阅我们的每日和每周通讯,获取行业领先的人工智能覆盖的最新更新和独家内容。埃隆·马斯克的人工智能初创公司xAI发布了格洛克3,据称这是xAI最新的AI模型,在关键技术基准上超越了主要竞争对手。这一发布标志着在开发更强大AI系统竞赛中的重要进展。就在几天前马斯克以974亿美元尝试收购开放人工智能未果之后,xAI发布了格洛克3。在X平台的一次直播演示中,马斯克表示格洛克3“比格洛克2强大一个数量级”,并强调其解决复杂问题的能力。初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3在聊天机器人竞技场排行榜上以大约1400分的成绩领先,显著优于其他主要AI模型在盲测用户测试中的表现。

初步测试结果似乎支持xAI的一些说法。该模型在有影响力的聊天机器人竞技场排行榜上名列前茅,在盲测用户测试中得分高于开放人工智能的GPT-4o、谷歌的Gemini以及深寻的V3模型。公布的基准显示,格洛克3在数学(AIME’24)、科学推理(GPQA)和编程任务中取得了优异成绩。格洛克3显然具备接近最先进的思考能力,“格洛克3的推理能力接近最先进水平,”前开放人工智能研究员安德烈·卡帕西在早期访问测试后在X上写道。“很少有模型能够可靠地做到这一点。顶级的开放人工智能模型也能做到这一点,但深寻-R1、Gemini 2.0快速思考和Claude都无法做到。”

开发该模型需要大量的计算资源。xAI将其GPU集群翻倍至20万台Nvidia芯片用于训练,并安置在一个新的孟菲斯数据中心内。这种基础设施投资突显了先进AI开发对计算资源日益增长的需求,因为各家公司竞相构建更强大的系统。深度搜索和高级推理:格洛克3如何旨在超越ChatGPT和谷歌Gemini。一项关键创新是格洛克3的“深度搜索”功能,它结合了网络搜索和推理能力来分析来自多个来源的信息。该系统还包括专门模式用于复杂问题解决,包括一个展示其推理过程的“思考”功能和一个分配额外计算能力给困难任务的“大脑”模式。“在人工智能领域真正值得关注的是学习速度。而@xai的学习速度远超其他技术,”科技行业资深人士罗伯特·斯科尔布引用与苹果Siri联合创始人汤姆·格鲁伯的对话后发帖说。然而,在测试中也发现了一些局限性。卡帕西指出,该模型有时会编造引用,并且在某些类型的幽默和伦理推理任务上存在困难。这些挑战在目前的AI系统中普遍存在,突显出开发真正类人的人工智能所面临的持续难题。Scale.ai首席执行官亚历山大·王称赞了这一发布,他在推特上写道:“格洛克3是@xai团队的新世界最佳模型!”他指出了其在各种基准上的优越性能,并表达了对未来合作的热情。

人工智能领域的竞争升温:格洛克3的发布对开放人工智能、深寻和人工智能的未来意味着什么。该模型将通过X的高级订阅(每月40美元)和一个新的独立“超级格洛克”服务(每月30美元)提供。企业API访问计划在未来几周内推出。这一发布加剧了人工智能领域的竞争,特别是因为中国初创公司深寻最近展示了类似性能,据报道其所需的计算资源更少。这一发展也引发了关于人工智能军备竞赛可持续性的疑问,因为各家公司投入数十亿美元在日益强大的硬件基础设施上。在关键性能基准方面,格洛克3及其迷你版在数学、科学和编程测试中相比谷歌、开放人工智能、Anthropic和深寻的竞争模型表现更佳。全尺寸的格洛克3模型(深蓝色)在科学推理方面尤为出色。

马斯克强调,格洛克3仍处于测试阶段,预计“几乎每天都”会有改进。该公司计划在几周内增加语音交互功能,并在新版本稳定后开源之前的格洛克2模型。然而,也许格洛克3首次亮相最引人注目的方面并不是其技术规格或基准分数,而是它所代表的内容:马斯克与他在开放人工智能的前同事们之间的关系日益紧张。在他以974亿美元尝试收购开放人工智能未果后的几天内,马斯克就推出了一个挑战其主导地位的模型——这表明在人工智能主导权的高风险竞争中,即使被拒绝的追求者也可能成为强有力的对手。

每日商业应用场景洞察

如果您希望给老板留下深刻印象,VB每日可以帮到您。我们为您提供公司如何使用生成式人工智能的内部信息,帮助您分享见解以实现最大回报。立即订阅阅读我们的隐私政策感谢您的订阅。

查看更多VB新闻通讯。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日