快速阅读: 12月17日消息,研究团队推出新基准FrontierScience,用于评估AI在物理、化学、生物等领域的科研推理能力。GPT-5.2在竞赛型任务中得分77%,但在真实科研场景中仅得25%,显示其在开放式思维上仍存局限。 在科学 […]