快速阅读: 全球50余位物理学家开发“CritPt”基准测试,评估AI处理复杂物理研究的能力。Google的Gemini3Pro和OpenAI的GPT-5表现不佳,最高准确率仅9.1%。测试涵盖11个物理领域,强调未发表研究内容。AI未来或 […]