FrontierScience – 数智风暴

FrontierScience发布新基准评估AI科学推理能力

快速阅读: 12月17日消息，研究团队推出新基准FrontierScience，用于评估AI在物理、化学、生物等领域的科研推理能力。GPT-5.2在竞赛型任务中得分77%，但在真实科研场景中仅得25%，显示其在开放式思维上仍存局限。在科学 […]

发布时间：2025-12-17 19:11 来源：szf