高级多智能体 AI 提示的提示工程

快速阅读: 据《福布斯》最新报道，本文介绍了多能动型人工智能（AI）的发展，以及如何有效编写提示以调用合适的AI代理。作者提出两种方法：用户主动选择AI代理（驾驶员座位）和AI自主选择（乘客座位），并详细阐述了每种方法的核心规则。此外，文章还讨论了生成式AI在多代理系统中的应用，强调了训练AI以更好地匹配用户请求的重要性。未来，随着技术进步，掌握这些技巧将变得更为重要。

最新的生成式人工智能（AI）和能动型AI的进展。盖帝在今天的专栏中，我将介绍并展示一种新的提示方法，以充分利用多能动型AI。事情是这样的。我们将越来越多地见证能动型AI的到来，它由生成式AI和执行一系列指定任务的大语言模型（LLMs）组成。结果是，将会有很多这样的能动型AI。接下来的问题是如何适当地编写提示，以便调用正确的能动型AI来完成你想要的工作。在今天的专栏中，我将介绍并展示一种新的提示方法，以充分利用多能动型AI。可能会有几十个、几百个或几千个能动型AI可供调用。你的提示必须确保准确无误，否则，你可能会调用不需要的能动型AI，而且你可能还会错过应该调用的能动型AI。让我们来谈谈这个问题。这项对一项创新AI突破的分析是我持续为福布斯撰写专栏的一部分，涵盖AI领域的最新进展，包括识别和解释各种有影响力的AI复杂性（请参阅链接）。提示工程遇见能动型AI读者可能还记得，我之前发布了一篇深入描述超过五十种提示工程技术的文章，请参阅链接。顶尖的提示工程师明白，深入学习大量经过研究和验证的提示技巧是充分利用生成式AI的最佳途径，并且可能会因此获得丰厚的回报。提示工程遇见能动型AI提示工程领域的一个新变化是能动型AI的出现。提示工程遇见能动型AI我将从讨论能动型AI的构成开始。提示工程遇见能动型AI想象一下，你正在使用生成式AI来规划一次旅行。你通常会登录到你的生成式AI账户，比如使用ChatGPT、GPT-40、O1、O3、Claude、Gemini、Llama等。由于生成式AI的自然语言流畅性，你的旅行规划会变得非常简单。你只需要描述你想去哪里，然后就可以无缝地进行关于住宿地点的优缺点以及可用的交通选项的重点对话。当涉及到预订行程时，你很可能会退出生成式AI，开始访问酒店、游乐园、航空公司和其他地点的网站来购买票务。目前大多数主要的生成式AI都不会为你采取下一步行动。你需要自己完成这些琐碎的任务。这就是代理和能动型AI发挥作用之处。在过去，你无疑会打电话给旅行社来预订行程。虽然仍然有人类旅行社，但另一个选择是使用基于生成式AI的旅行社。能动型AI具有你期望的生成式AI的互动性。它还预装了一系列例行程序或任务集，这些任务可以执行旅行社的工作。使用日常自然语言，你可以与能动型AI互动，它会在你的计划中与你合作，并可以继续处理你的旅行计划预订。哇哦，这个能动型AI将开始执行一系列努力以满足你的旅行预订请求。能动型AI具有你期望的生成式AI的互动性。它还预装了一系列例行程序或任务集，这些任务可以执行旅行社的工作。使用日常自然语言，你可以与能动型AI互动，它会在你的计划中与你合作，并可以继续处理你的旅行计划预订。多能动型AI更好如果一个能动型AI是一件好事，那么我们不妨加大赌注，目标是利用大量的能动型AI。世界正朝着拥有数以亿计的能动型AI的方向发展，它们做这做那。我可以向你保证，这将使每个人头昏脑胀。会有比你能想到的更多的AI代理。多能动型AI更好好消息是，将会有大量的能动型AI供你选择。丰富的资源。坏消息是，试图确定要调用哪些能动型AI将是一项艰巨的任务。想象一下，你输入了一个提示，调用了大量的能动型AI代理。如果你无意中调用了不需要使用的，这对你是不利的。很可能你需要为它们的使用付费，无论它们是否对你有用。也有很大的可能性，一个不相关的代理AI最终会干扰你正在尝试做的事情。另一方面，如果你的提示没有调用你应该使用的代理AI，那么问题就会是你解决问题的努力可能会失败。一个关键的代理AI本应启动却没有被激活。就像链条中的一环缺失，缺少任何一个必要的代理AI都可能导致没有答案或错误的答案。想象一下，你输入了一个提示，调用了大量的能动型AI代理。如果你无意中调用了不需要使用的，这对你是不利的。很可能你需要为它们的使用付费，无论它们是否对你有用。也有很大的可能性，一个不相关的代理AI最终会干扰你正在尝试做的事情。关于我最近对所谓“编排”在多能动型AI中的新兴作用的最新报道，请参阅链接。确保坐在正确的座位上在我的提示工程课程中，我强调，当涉及编写与多代理AI相关的提示时，可以将其视为两种主要方法。这两种方法各有优劣。更多内容谷歌将在4月3日删除我的Gmail和照片——如何保存你的针对比特币持有者的物理攻击随着BTC价格上涨而激增州街取消公司董事会多元化要求：所有削减DEI项目的公司在我们深入讨论之前，我想先分享一些我在课堂上介绍的经验法则。每种方法都有五条核心规则。我精简出了每种方法的关键五条规则。我的驾驶员座位规则如下。类别1：用户处于驾驶员座位（手动选择AI代理）(1) 确保明确指出要使用的AI代理名称及该代理需要为你执行的具体任务。(2) 提前仔细考虑你打算调用的AI代理的顺序。(1) 确保明确指出要使用的AI代理名称及该代理需要为你执行的具体任务。(3) 了解每个代理的输入和输出，以及它们是否与其他代理有数据交互。(4) 深入研究每个代理可能执行的操作，并确定是否存在功能重叠。(3) 了解每个代理的输入和输出，以及它们是否与其他代理有数据交互。(5) 通过练习使用这些AI代理，以便在真正需要时能熟练操作。我的乘客座位规则如下。类别2：用户处于乘客座位（监督AI做出代理选择）我的乘客座位规则如下。(1) 明确你希望完成的任务，无需担心具体使用哪个AI代理（让监督AI来决定）。(2) 告知监督AI任何优先事项或问题。(1) 明确你希望完成的任务，无需担心具体使用哪个AI代理（让监督AI来决定）。(3) 询问监督AI决定使用哪些代理。(1) 明确你希望完成的任务，无需担心具体使用哪个AI代理（让监督AI来决定）。(4) 代理可能会提供解释，但通常只有在请求时才会这么做，因此在让监督AI开始任务前最好先给它一个提示。(1) 明确你希望完成的任务，无需担心具体使用哪个AI代理（让监督AI来决定）。(5) 预计需要与监督AI进行多次迭代以确保一切顺利。你将在我即将展示的例子中看到这些规则的应用。多代理场景设想你可以调用以下五个AI代理：(1) 代码修复器：一个用于调试和优化编程代码的AI代理。(2) 代码审查员：一个用于审查代码以确保最佳实践和可维护性的AI代理。(1) 代码修复器：一个用于调试和优化编程代码的AI代理。(3) 缺陷猎手：一个用于识别代码中的安全漏洞和逻辑错误的AI代理。(4) 性能分析器：一个用于评估代码性能并提出优化建议的AI代理。(5) 文档撰写者：一个用于为代码库生成文档的AI代理。了解这些AI代理的功能及其相关条件是很重要的。你可以使用这些AI代理中的任何一个。没有AI代理会自动调用另一个代理。主要调用者需在需要时指定调用代理的顺序。这些AI代理之间存在一些重叠。例如，代码审查员在审查代码时可能会潜在地识别安全漏洞，而缺陷猎手则专门寻找安全漏洞并努力发现它们。它们都涉及安全性。另一个例子是代码修复器优化代码，性能分析器也是如此。请记住这些重叠，并决定哪个AI代理最适合你的需求。驾驶员座位示例最简单的展示就是我采用驾驶员座位。在我的提示中，我会告诉生成式AI要调用哪些代理式AI。从某种意义上说，生成式AI只是充当中介，并将按照我在提示中指定的方式执行代理式AI。让我们开始吧。我输入的提示：“我需要一些关于我的Python脚本的帮助。它运行了，但我认为它有点慢并且可能有一些错误。请运行代理代码修复器。完成后，运行代理缺陷猎手。接下来运行性能分析器，因为我希望看到代码是否运行得更快并且看起来没有错误。就这样，一旦序列完成，请通知我。”生成式AI回应道：“我将按此顺序调用代码修复器、缺陷猎手和性能分析器。完成后，我会向您展示结果。您还需要运行文档撰写者来获取完整文档吗？”我输入的提示：“您已经得到了正确的顺序，谢谢。目前不需要额外运行文档撰写者。在我看过其他三个AI代理的结果后再考虑是否使用它。”生成式AI回应道：“好的，正在继续。”请注意，生成式AI试图澄清我想要做什么，并给了我一个有用的总结。这是很有用的，因为如果我遗漏或忘记调用重要的代理式AI，这可能会有所帮助。同样，生成式AI可能会误解我的提示并错误地安排需要完成的工作。生成式AI试图双重检查我的请求，并建议运行额外的代理式AI。我告诉生成式AI在这种情况下不需要运行额外的AI代理。请注意，生成式AI试图澄清我想要做什么，并给了我一个有用的总结。这是很有用的，因为如果我遗漏或忘记调用重要的代理式AI，这可能会有所帮助。同样，生成式AI可能会误解我的提示并错误地安排需要完成的工作。很高兴看到AI支持我。😊你可以看到，生成式AI告知了我它打算运行的各个可用AI代理。是否想知道这些信息取决于你自己。你可以明确地告诉生成式AI直接开始运行，无需解释它将要做什么。通常情况下，我更喜欢让生成式AI告诉我它的计划。在这个例子中，生成式AI打算运行文档撰写者代理。我现在并不需要这个功能。运行它会无谓地增加我的计费费用——只有在我确定代码完成并准备发布时才会运行文档撰写者。避免使用乘客座的不明确指导如果你选择使用乘客座的方法，请确保明确表示你想要使用代理AI。我提到这一点是因为你的提示可能会过于模糊，而生成式AI无法领会你的意图。看看这个例子。我输入的提示：“我需要一些帮助来修改我的Python脚本。”生成式AI的回复：“我很乐意帮你修改Python脚本。我有几种AI代理可以用于调试和优化代码、审查代码、查找安全问题、进行性能分析以及生成文档。我需要了解更多关于你需要什么样的帮助。你有什么具体想法？”我输入的提示：“我不是很清楚需要什么样的帮助。我只知道代码运行缓慢并且似乎有一些错误。”生成式AI的回复：“明白了，我知道该怎么做。我会使用一系列代理，并在完成后向你报告结果。一旦你看完结果，我们可以讨论是否需要其他代理来进一步帮助你修改Python代码。你觉得这样怎么样？”我输入的提示：“这是个好计划。请开始吧。”在这种情况下，生成式AI幸运地选择了向我寻求一些必要的澄清。我模糊的“帮我修改Python脚本”的提示可能导致生成式AI朝许多不同的方向发展。生成式AI可能会仅仅同情我的困境，说些像“别因为需要帮助编写代码而沮丧”之类的话。记住，使用生成式AI就像是一盒巧克力——你永远不知道从提示中能得到什么。尽量始终保持具体。多代理AI的最新研究人工智能研究社区正在大力推进多代理AI的研究。你可以期待几乎每天都有新的见解涌现。我努力把特别值得关注的研究成果带给你。说到这个，Joshua Park和Yongfeng Zhang最近发表的一篇题为《AgentRec：基于句子嵌入的人类反馈代理推荐》的研究论文，arXiv，2025年1月23日，提出了以下要点（摘录）：“多代理系统必须决定哪个代理最适合给定的任务。”“然而，大多数关于这个问题的研究通常以固定顺序执行这些代理，并且只能允许一定类别的问题，因为没有一种稳健的方式灵活地确定哪些代理最适合执行给定任务。”“为了解决这个问题，我们贡献了AgentRec——一种可扩展、快速且高效的方法，根据自然语言提示选择一个代理来执行任务。”“以下代理分别是：(1) 技术支持代理，(2) 烹饪代理，(3) 数学代理，(4) 游戏代理，(5) 治疗代理，(6) 阅读代理，(7) 健康代理，(8) 健身代理。有些代理被选择得尽可能与其他代理无关——比如烹饪代理——而有些代理则被选择具有软重叠的专业领域，例如健康和健身代理。”“数据集代表了8个不同主题的代理，每个代理有1250个提示，总共10000个提示。”“通过使用句子嵌入，我们能够提取与选择代理相关的自然语言提示的语义内容，并将其与一组合成生成的提示进行比较，这些提示是特定代理预计能在不到300毫秒内回答的，对于8个代理，前1名测试准确率为92.2%。”我认为你会对这项研究特别感兴趣，因为它使用了一种专门的方法来选择AI代理。另一个我喜欢的因素是他们做了一个有趣的实验，包括八个AI代理并通过数千个提示来调用它们。这样做有助于长期识别什么有效，什么无效。生成式AI逐渐变得熟练上述研究的一个关键方面是有可能让生成式AI特别擅长于根据用户请求选择应该运行哪些代理AI。我们可以利用生成式AI的模式匹配能力来实现这一点。生成式AI逐渐变得熟练方法如下。将大量的提示及其对应的代理AI选择示例输入到生成式AI中进行数据训练（本质上，成对的数据）。生成式AI会专注于哪些提示最适合哪些代理AI的选择。经过足够的数据训练后，当你以乘客座的方式输入提示时，生成式AI将适当地匹配到应该调用哪些代理AI。因此，生成式AI的表现将优于随机选择，因为它已经接受了专门的数据训练。我预计我们会看到更多这样的情况，作为一种让生成式AI逐步趋向最佳或某些最优代理选择的方法。将大量的提示及其对应的代理AI选择示例输入到生成式AI中进行数据训练（本质上，成对的数据）。生成式AI会专注于哪些提示最适合哪些代理AI的选择。经过足够的数据训练后，当你以乘客座的方式输入提示时，生成式AI将适当地匹配到应该调用哪些代理AI。因此，生成式AI的表现将优于随机选择，因为它已经接受了专门的数据训练。现在你知道如何调用多代理AI以及应该使用的提示类型后，我建议你考虑练习这样做。熟能生巧。练习，练习，再练习。坦白地说，目前练习有点挑战，因为大多数主要的生成式AI应用程序都不允许用户直接调用代理AI。有些生成式AI应用程序会在你不知情的情况下为你调用它们，但甚至不会告诉你何时这么做，或者调用了哪些代理。这是一个混合的局面。变化正在迅速发生。现在你知道如何调用多代理AI以及应该使用的提示类型后，我建议你考虑练习这样做。熟能生巧。练习，练习，再练习。祝你好运，你可能还记得亚伯拉罕·林肯的名言：“未来最好的事情就是它一天天到来。”这对多代理AI的到来同样适用。

(以上内容均由Ai生成)