快速阅读: 近期,AAI推出AI评测基准FormulaOne,挑战GPT-5等顶尖模型,结果全部得零分。该基准包含220个高难度动态规划问题,考验AI推理能力,揭示其在复杂任务上的局限性。 近期,一个新的 AI 评测基准 FormulaOn […]