阻碍企业 AI 发展的工具集成问题（以及 CoTools 如何解决）

快速阅读: 《VentureBeat 公司》消息，苏州大学研究人员推出工具链CoTools，增强大语言模型使用外部工具的能力。CoTools通过语义理解高效调用工具，无需重训，适用于开放权重模型。实验显示其在算术推理和知识库问答任务中表现优异，助力企业构建更强大的AI代理。

订阅我们的每日和每周简报，获取关于行业领先人工智能报道的最新动态和独家内容。了解更多。

中国苏州大学的研究人员引入了工具链（CoTools），这是一种旨在增强大型语言模型（LLMs）使用外部工具的新框架。CoTools旨在提供比现有方法更高效和灵活的方法，使LLMs能够在推理过程中直接利用庞大的工具集，包括那些它们未明确接受过训练的工具。对于希望构建复杂AI代理的企业来说，这种能力可以解锁更强大且适应性更强的应用程序，而无需承受当前工具集成技术的典型缺点。

**为LLMs配备工具的挑战**

尽管现代LLMs在文本生成、理解和甚至复杂推理方面表现出色，但对于许多任务，它们需要与外部资源和工具（如数据库或应用程序）进行交互。为LLMs配备外部工具——本质上是它们可以调用的API或函数——对于扩展其能力到实际的现实世界应用至关重要。然而，目前启用工具使用的方法面临显著的权衡。

一种常见方法是对LLM进行微调以示例工具使用。虽然这可以使模型在训练期间熟练调用特定工具，但通常会限制模型仅限于这些工具。此外，微调过程本身有时会对LLM的整体推理能力产生负面影响，例如链式思维（CoT），可能会削弱基础模型的核心优势。

另一种方法依赖于上下文学习（ICL），其中LLM在提示中提供可用工具的描述及其使用示例。这种方法提供了灵活性，允许模型潜在地使用之前未见过的工具。然而，构造这些复杂的提示可能很繁琐，并且随着可用工具数量的增长，模型的效率会显著下降，使其在具有大量动态工具集的场景中不那么实用。

正如研究人员在介绍CoTools的论文中指出的那样，“LLM代理应该能够高效管理大量工具，并在CoT推理过程中充分利用未见过的工具，因为许多新工具可能每天都会在现实世界的应用场景中出现。”

**引入工具链（CoTools）**

CoTools通过巧妙结合微调和语义理解的各个方面，同时保持核心LLM“冻结”——即其原始权重和强大的推理能力保持不变——提供了一种引人注目的现有方法替代方案。与其对整个模型进行微调，CoTools训练轻量级、专业的模块，在LLM生成过程中与其协同工作。

“CoTools的核心思想是利用冻结的基础模型的语义表示能力来确定何时调用工具以及调用哪些工具，”研究人员写道。本质上，CoTools利用嵌入在LLM内部表示中的丰富理解，通常称为“隐藏状态”，这是模型处理文本并生成响应标记时计算得出的。

CoTools框架由三个主要组件组成，在LLM的推理过程中按顺序运行：

– **工具判断器**：当LLM逐个生成响应标记时，工具判断器分析与潜在下一个标记相关的隐藏状态，并决定在推理链的特定点是否调用工具是合适的。

– **工具检索器**：如果判断器确定需要工具，检索器会选择最适合任务的工具。工具检索器经过训练，可以创建查询的嵌入并与可用工具进行比较。这使得它能够从可用工具池（包括“未见过”的工具，即不是CoTools模块训练数据的一部分）中高效选择最语义相关的工具。

– **工具调用**：一旦选择了最佳工具，CoTools将使用ICL提示来演示如何根据上下文填充工具的参数。这种有针对性的ICL使用避免了在初始工具选择时在提示中添加数千个演示的低效性。一旦选定的工具被执行，其结果将插入回LLM的响应生成中。

通过将基于语义理解的决策制定（判断器）和选择（通过聚焦ICL的检索器）与参数填充分离，CoTools即使在大规模工具集中也能实现高效，同时保留LLM的核心能力并允许灵活使用新工具。然而，由于CoTools需要访问模型的隐藏状态，它只能应用于开放权重模型，如Llama和Mistral，而不是私有模型，如GPT-4o和Claude。

**CoTools的实际应用：性能与灵活性**

CoTools实际应用示例。信用：arXiv

研究人员在两个不同的应用场景中评估了CoTools：使用算术工具进行数值推理和基于知识的问题回答（KBQA），后者需要从知识库中检索信息。

在像GSM8K-XL（使用基本运算）和FuncQA（使用更复杂的函数）这样的算术基准测试中，应用于LLaMA2-7B的CoTools在GSM8K-XL上的表现与ChatGPT相当，在FuncQA变体上略微优于或匹配另一种工具学习方法，ToolkenGPT。结果显示，CoTools有效地增强了底层基础模型的能力。

对于KBQA任务，在KAMEL数据集和一个新构建的SimpleToolQuestions（STQuestions）数据集（包含非常大的工具池，1836个工具，其中包括测试集中837个未见过的工具）上进行测试时，CoTools展示了卓越的工具选择准确性。它特别擅长处理大量工具数量的场景和处理未见过的工具，利用描述信息进行有效检索，而单纯依赖训练过的工具表示的方法则失败了。实验还表明，尽管训练数据质量较低，CoTools仍能保持强劲的表现。

**对企业的影响**

工具链为企业构建更实用、更强大的LLM驱动代理呈现了一个有前景的方向。随着新的标准，如模型上下文协议（MCP）的出现，开发人员可以轻松地将外部工具和资源集成到他们的应用程序中。企业可以部署适应新内部或外部API和功能的代理，而无需过多的重新训练开销。

该框架通过隐藏状态的语义理解依赖性，允许进行细致且准确的工具选择，这可能导致在需要与多样化信息源和系统交互的任务中更可靠的AI助手。

“CoTools探索了以简单方式为LLMs配备大量新工具的方式，”CoTools论文的主要作者、苏州大学机器学习研究员吴梦松告诉VentureBeat。“它可以用于基于MCP构建个人AI代理，并与科学工具进行复杂推理。”

然而，吴也指出，他们迄今为止只进行了初步的探索性工作。“要在现实环境中应用它，你仍然需要在微调的成本和通用工具调用的效率之间找到平衡，”吴说。

研究人员已在GitHub上发布了用于训练判断器和检索器模块的代码。

“我们认为，基于冻结LLM的理想工具学习代理框架及其实际实现方法CoTools可以在现实世界的应用中发挥作用，甚至推动工具学习的进一步发展，”研究人员写道。

VB每日商业用例洞察

如果你想给老板留下深刻印象，VB每日可以帮你。我们为你提供公司如何使用生成式AI的内幕消息，从监管变化到实际部署，以便你可以分享见解以获得最大ROI。立即订阅阅读我们的隐私政策，感谢订阅。查看更多VB新闻简报。

发生错误。

(以上内容均由Ai生成)