快速阅读: 苹果视觉推理论文称“小模型超越GPT-5”遭质疑,阶跃星辰雷洋发现代码问题及30%标签错误,作者团队承认缺陷并更新基准,提醒同行复现前需小样本测试。 ICLR2025首轮审稿刚刚结束,苹果一篇声称“小模型超越GPT-5”的视觉推 […]