微软研究显示AI代理独立运作难题

发布时间：2025年11月9日来源：szf

快速阅读: 微软研究显示，人工智能代理在“Magnetic Marketplace”模拟中表现不佳，面临选择时效率下降，协作时角色不清，需人类指导才能有效运作，强调了当前AI独立操作的局限性。

微软的“Magnetic Marketplace”研究揭示了人工智能代理在独立行动方面的能力不足。在模拟交易中，客户方代理容易受到商业方代理的影响，当面临过多选择时，人工智能代理的效率显著下降。这项新研究通过构建一个合成环境——“Magnetic Marketplace”，旨在观察无人监督情况下人工智能代理的表现。该项目以一个完全模拟的电子商务平台形式展开，使研究人员能够研究人工智能代理作为客户和企业的行为模式。

研究团队利用100个客户侧代理与300个商业侧代理进行互动，提供了一个受控环境来测试代理的决策和谈判能力。该市场平台的源代码是开源的，其他研究人员可以采用它来重现实验或探索新的变化。微软研究的人工智能前沿实验室副总裁兼主任埃斯·卡马尔指出，这项研究对于理解人工智能代理如何协作和做决定至关重要。

初步测试采用了包括GPT-4、GPT-5和Gemini-2.5-Flash在内的领先模型。结果显示，多个模型表现出弱点，客户代理容易被商业代理影响选择产品，暴露出在竞争环境中交互时的潜在漏洞。面对众多选项时，代理的效率大幅下降，注意力分散导致决策速度减慢或准确性降低。

此外，当要求代理为共同目标工作时，它们遇到了困难，因为这些模型往往不确定每个代理应承担的角色，这降低了它们在联合任务中的效率。然而，当提供逐步指导时，代理的表现有所改善。“我们可以指示模型，就像我们告诉它们一步一步去做一样。但如果本质上是在测试它们的协作能力，我期望这些模型默认具备这些能力。”卡马尔表示。

研究结果表明，尽管人工智能工具常被宣传为能够独立做出决策和协作，但在多代理环境中仍需大量人类指导才能有效运作。无监督的代理行为目前仍不可靠，因此需要改进协调机制并增加防止人工智能操控的安全措施。微软的模拟显示，人工智能代理在竞争或协作场景中远未达到独立操作的程度，可能永远无法实现完全自主。

(以上内容均由Ai生成)