快速阅读: 微软开源rStar2-Agent模型,140亿参数,创新智能体强化学习技术,多项数学测试超越6710亿参数模型,训练效率高,响应快,泛化能力强。 微软研究院开源的rStar2-Agent模型在AI数学推理领域引起广泛关注。这款拥 […]