英伟达推出新 AI 框架，8亿参数模型助力工具智能管理

发布时间：2025年12月5日来源：szf

快速阅读: 英伟达与香港大学合作发布8亿参数模型Orchestrator，采用ToolOrchestra框架训练，能高效协调多种工具解决复杂问题，降低计算成本，提升准确性。

近日，英伟达与香港大学的研究人员共同发布了名为“Orchestrator”的新模型。该模型拥有8亿个参数，能够协调不同工具和大型语言模型（LLM）解决复杂问题。在实验中，Orchestrator 以更低的成本实现了更高的准确性，并能根据用户偏好智能选择合适的工具。

Orchestrator 的训练采用了名为 ToolOrchestra 的新强化学习框架，旨在培养小型模型作为智能协调者。该方法的核心理念是，通过一个轻量级的“协调者”管理多种专业模型和工具，能够比单一庞大的 AI 系统更高效地解决问题。

目前，大多数大型语言模型工具是将基本工具（如网络搜索或计算器）与强大模型结合使用。研究人员认为，人类在推理时会调用各种超越自身智能的资源，因此 LLMs 也应能够与多种工具互动。为此，他们提出从单一模型系统转变为由多个模型组成的复合系统，协调者分析复杂任务，将其分解为子任务，并按需调用适当的工具。

通过 ToolOrchestra 框架，研究团队训练了 Orchestrator 模型，并对其在三个具有挑战性的基准上的表现进行了评估。与几种大型通用模型相比，Orchestrator 在处理博士级问题的“HLE”基准上展现出显著优势，且计算成本远低于其他方法。特别是在调用工具时，Orchestrator 能有效安排不同工具的使用，在保持高效的同时减少了高成本模型的调用。

研究者表示，经过强化学习训练的 Orchestrator 展现了强大的通用推理能力，能够灵活应对新挑战。对于企业应用而言，Orchestrator 能够很好地适应未见过的模型和定价结构，为依赖多种 AI 模型的企业提供了更加经济和灵活的解决方案。

项目链接：https://research.nvidia.com/labs/lpr/ToolOrchestra/

划重点：

– 🌟 Orchestrator 是一个8亿参数的模型，能够智能协调多种工具，提升 AI 的推理能力。

– 💡 ToolOrchestra 框架使用强化学习训练小模型，以更高效的方式管理复杂任务。

– 🚀 Orchestrator 在多个基准测试中表现出色，显著降低计算成本，并适应多种企业需求。

(以上内容均由Ai生成)