尽管存在安全问题,但 Grok 4 在法学硕士排名中超越了 Claude 和 DeepSeek。
快速阅读: 《可混搭》消息,BleepingComputer报道,7月11日,LMArena测试了Grok-4-0709版本,但该版本可能未展现Grok 4真实实力。因Grok 4 Heavy尚未开放API,无法评估其性能。
据BleepingComputer报道,7月11日,LMArena平台使用了Grok 4的API版本Grok-4-0709进行测试。LMArena指出,这一版本的表现可能未完全展示Grok 4的真实实力,因为其测试的是普通版本而非Grok 4 Heavy。Grok 4 Heavy模型集成了多个智能体,能协同工作以提供更高质量的响应。不过,由于Grok 4 Heavy尚未开放API访问,LMArena暂时无法对其性能进行评估。
(以上内容均由Ai生成)