快速阅读: 《雅虎美国》消息,近日,OpenAI的O3模型因基准测试结果差异引发透明度质疑。OpenAI称其在FrontierMath中答对超25%,但Epoch测试仅得10%。差异可能源于计算能力、测试环境或数据集不同。这促使人们对模型测 […]