DeepSeek 推出新的 AI 推理方法，对其下一代模型的期待不断上升

发布时间：2025年4月6日来源：szf

快速阅读: 据《南华早报》称，AI初创公司深度求索与清华合作，开发结合生成式奖励和自我批评优化的技术，提升大模型推理能力。公众期待其下一代模型发布，这可能推动AI领域新发展。

人工智能（AI）初创公司**深度求索**（DeepSeek）近日提出了一种改进大型语言模型（LLMs）推理能力的新方法，公众正翘首以盼其下一代模型的发布。近日，一篇论文披露，深度求索与清华大学的研究人员携手开发出一种结合生成式奖励模型（GRM）和自我原则批评调优的技术，旨在让大型语言模型能够更高效、更精准地应对通用查询任务。

这项研究通过融合生成式奖励机制与自我原则批评优化策略，为语言模型的推理能力注入了新的活力。研究人员相信，这种创新方法不仅提升了模型对复杂问题的理解水平，还显著提高了其响应速度。随着这项技术的逐步完善，未来在多领域应用中，深度求索的下一代模型有望展现更为卓越的表现。

目前，公众对于这一突破性成果充满期待，而深度求索与清华大学的合作也进一步彰显了产学研协同创新的重要意义。让我们共同关注这款即将问世的下一代模型，它或将引领人工智能领域进入一个全新的发展阶段。

(以上内容均由Ai生成)