马斯克表示 Grok 3 将是“迄今为止最好的 AI 模型”
快速阅读: 据《药物发现与开发》最新报道,埃隆·马斯克在迪拜宣布,他的AI聊天机器人格洛克3即将发布,号称超越了包括ChatGPT和DeepMind Gemini在内的所有竞品。格洛克3在xAI的“巨人”超级计算机上进行了大量训练,具备自我改进和实时纠错能力。尽管前xAI工程师对格洛克3的排名存在争议,但马斯克表示,该模型将在一至两周内发布。
埃隆·马斯克在迪拜世界政府峰会上通过视频宣布了他的人工智能聊天机器人格洛克3的最新版本,声称它超越了所有当前的人工智能竞争对手,包括OpenAI的ChatGPT、谷歌的DeepMind Gemini等。马斯克称格洛克3为“非常智能”且“在推理方面非常强大,能够……提出你甚至无法预料的解决方案——非显而易见的解决方案”。“在我们迄今为止进行的测试中,格洛克3的表现超过了我们所知道的所有已发布的产品,这是一个好迹象,”马斯克继续说道。马斯克明确指出,格洛克3据说超越了包括OpenAI的ChatGPT和谷歌DeepMind的Gemini在内的其他竞争对手。马斯克表示,xAI正处于“格洛克3最终打磨阶段”的最后阶段。路透社的一段视频显示,马斯克说该模型预计在一到两周内发布。马斯克表示,最终的打磨将带来更好的用户体验。截至目前,马斯克的声明基于xAI内部的测试。尚未分享任何公开基准。前xAI工程师本杰明·德克雷克在X平台上发布了专注于代码的人工智能排名,将格洛克3排在OpenAI顶级模型之后,这引发了与xAI管理层的争执,并最终导致德克雷克辞职。无论如何,格洛克3是在xAI的“巨人”超级计算机上进行了大量的计算训练。据报道,格洛克3消耗了约2亿个GPU小时,远远超过了众多同行的计算使用量。为了比较,GPT-3(1750亿参数)据说在Nvidia V100上消耗了约300万个GPU小时。据维基百科报道,Meta的Llama 3.1(4050亿参数)在使用高端Nvidia H100-80GB GPU时大约消耗了3100万个GPU小时,而DeepSeek V3(6710亿参数)在Nvidia H800 GPU上使用了约280万个GPU小时。自我改进功能和训练方法格洛克3自称的独特之处在于其自我改进的能力。根据马斯克的说法,该模型会监测自己的输出准确性,“反思数据”,并自我纠正任何不实信息——这种方法xAI认为可以减少人工智能的“幻觉”。这种“自我纠正机制”据说使格洛克3区别于依赖周期性更新而非实时自我调整的GPT-4和Anthropic的Claude。另一个不同点是合成数据训练,旨在避免因网络抓取数据而产生的法律纠纷,并强调逻辑一致性。马斯克在彭博社发布的一段视频中声称,这种合成数据集与自我纠正相结合,赋予了格洛克3更出色的推理能力。“如果它有错误的数据,它实际上会反思并移除这些错误数据,”马斯克说。“即使未经微调,格洛克3基础模型也优于格洛克2。”
(以上内容均由Ai生成)