IIT-JEE Advanced 的顶级产品是…双子座 2.5 Pro
快速阅读: 据《印度分析杂志》称,字节跳动发布“种子1.6”AI模型白皮书,其“种子1.6-思考”在IIT-JEE考试中获329.6分,排名第二。Gemini 2.5 Pro得336.2分,创最高分。考试难度高,录取率不足2%。
中国科技巨头字节跳动上周发布了其“种子1.6”系列人工智能模型的技术白皮书。在这份报告中,公司展示了该模型在各类评估中的表现,包括它在各类高考中的得分情况。“种子1.6-思考”(推理)模型与谷歌的Gemini 2.5 Pro、Anthropic的Claude Opus 4以及OpenAI的o4-mini-high模型一起参加了印度理工学院2025年联合入学考试(IIT-JEE)高级阶段考试。结果显示,Gemini 2.5 Pro在360分中获得336.2分,超过2025年考试中获得最高分332分的考生。“种子1.6-思考”模型获得了329.6分,排名第二,领先于Claude Opus 4(314.4分)和o4-mini-high(308.4分)。字节跳动通过图像输入对这些模型进行了测试,并评估了它们的多模态和推理能力。虽然所有客观题均进行了五次抽样测试,但报告公布了每个样本的平均得分。此外,分数是根据标准的JEE考试规则进行分配的,即答错题将被扣分。IIT-JEE高级阶段考试被广泛认为是世界上最难的考试之一,这是印度理工学院招生考试的第二阶段。在第一阶段的IIT-JEE主考中,前2.5万名考生可进入高级考试。考生需参加物理、化学和数学的考试。进入印度理工学院的录取率通常不足2%。Gemini 2.5 Pro模型在化学科目中获得最高分,而“种子1.6-思考”模型则在数学科目中获得最高分。后者在与其他参加考试的考生比较时也位列第四。
(以上内容均由Ai生成)