快速阅读: 腾讯AI实验室推出Training-Free GRPO技术,通过外部知识库更新代替参数微调,显著降低成本同时提升模型性能。实验显示,该技术在数学推理和网络搜索任务中表现优异,优化成本低至120元人民币。 腾讯AI实验室最近推出了 […]