微软研究显示AI代理独立运作难题
快速阅读: 微软研究显示,人工智能代理在“Magnetic Marketplace”模拟中表现不佳,面临选择时效率下降,协作时角色不清,需人类指导才能有效运作,强调了当前AI独立操作的局限性。
微软的“Magnetic Marketplace”研究揭示了人工智能代理在独立行动方面的能力不足。在模拟交易中,客户方代理容易受到商业方代理的影响,当面临过多选择时,人工智能代理的效率显著下降。这项新研究通过构建一个合成环境——“Magnetic Marketplace”,旨在观察无人监督情况下人工智能代理的表现。该项目以一个完全模拟的电子商务平台形式展开,使研究人员能够研究人工智能代理作为客户和企业的行为模式。
研究团队利用100个客户侧代理与300个商业侧代理进行互动,提供了一个受控环境来测试代理的决策和谈判能力。该市场平台的源代码是开源的,其他研究人员可以采用它来重现实验或探索新的变化。微软研究的人工智能前沿实验室副总裁兼主任埃斯·卡马尔指出,这项研究对于理解人工智能代理如何协作和做决定至关重要。
初步测试采用了包括GPT-4、GPT-5和Gemini-2.5-Flash在内的领先模型。结果显示,多个模型表现出弱点,客户代理容易被商业代理影响选择产品,暴露出在竞争环境中交互时的潜在漏洞。面对众多选项时,代理的效率大幅下降,注意力分散导致决策速度减慢或准确性降低。
此外,当要求代理为共同目标工作时,它们遇到了困难,因为这些模型往往不确定每个代理应承担的角色,这降低了它们在联合任务中的效率。然而,当提供逐步指导时,代理的表现有所改善。“我们可以指示模型,就像我们告诉它们一步一步去做一样。但如果本质上是在测试它们的协作能力,我期望这些模型默认具备这些能力。”卡马尔表示。
研究结果表明,尽管人工智能工具常被宣传为能够独立做出决策和协作,但在多代理环境中仍需大量人类指导才能有效运作。无监督的代理行为目前仍不可靠,因此需要改进协调机制并增加防止人工智能操控的安全措施。微软的模拟显示,人工智能代理在竞争或协作场景中远未达到独立操作的程度,可能永远无法实现完全自主。
(以上内容均由Ai生成)