提高代理可靠性的新方法 AgentSpec 强制代理遵循规则
快速阅读: 据《VentureBeat 公司》称,研究团队推出AgentSpec系统,旨在提高基于大语言模型(LLM)的AI代理可靠性。AgentSpec通过定义触发器、条件和强制机制来限制代理操作范围。测试显示,该系统显著减少了不安全行为,并适用于多种框架。专家认为,随着自主代理的普及,类似工具的需求将持续增长。
订阅我们的每日和每周简报,获取行业领先的人工智能报道的最新动态和独家内容。点击了解更多信息。
人工智能代理存在安全性与可靠性问题。尽管这些代理能够帮助企业自动化更多的工作流程步骤,但在执行任务时可能会采取意想不到的行动,不够灵活且难以控制。组织已对不可靠的代理发出警告,担心一旦部署,代理可能会忘记遵循指令。甚至承认要确保代理可靠性,需要与外部开发人员合作,因此它开放了其代理软件开发工具包(SDK)以帮助解决这个问题。然而,新加坡管理大学(SMU)的研究人员已经开发出一种新的方法来解决代理可靠性问题。
**AgentSpec** 是一种特定领域的框架系统,允许用户“定义包含触发器、谓词和强制机制的结构化规则”。研究人员表示,AgentSpec 将使代理仅在用户希望的参数范围内工作。
用新方法引导基于LLM的代理
**AgentSpec** 并不是一个新的大型语言模型(LLM),而是一种引导基于LLM的AI代理的方法。研究人员相信,AgentSpec 不仅可以在企业环境中用于代理,还可以用于自动驾驶应用程序。
第一个集成在LangChain框架上的AgentSpec测试显示,但研究人员表示他们设计它是框架无关的,这意味着它也可以在AutoGen和Apollo等生态系统上运行。使用AgentSpec的实验表明,它防止了“超过90%的不安全代码执行,确保了在自动驾驶违规场景下的完全合规性,消除了具身代理任务中的危险行为,并以毫秒级的开销运行。”
使用OpenAI的o1生成的AgentSpec规则也表现出色,强制执行了87%的高风险代码,并在8个场景中的5个中防止了违法行为。
当前方法略显不足
**AgentSpec** 并不是唯一帮助开发者为代理带来更多控制和可靠性的方法。其中一些方法包括ToolEmu和GuardAgent。初创公司Galileo推出了确保代理按预期工作的解决方案,这是一种确保代理按预期工作的方法。开源平台H2O.ai 利用预测模型使金融、医疗、电信和政府公司的代理更加准确。
研究AgentSpec的研究人员表示,当前缓解风险的方法(如ToolEmu)有效地识别风险。他们指出,“这些方法缺乏可解释性,没有提供安全强制机制,使其容易受到对抗性操纵。”
使用AgentSpec
**AgentSpec** 作为代理的运行时强制层工作。它拦截代理在执行任务时的行为,并添加由人类定义或由提示生成的安全规则。由于**AgentSpec**是一种定制的领域特定语言,用户需要定义安全规则。这有三个组成部分:首先是触发器,确定何时激活规则;其次是检查条件并强制执行如果违反规则应采取的操作。
虽然如前所述,**AgentSpec**是基于LangChain构建的,但研究人员表示,**AgentSpec**也可以集成到其他框架中,例如AutoGen或自动驾驶汽车软件堆栈Apollo。这些框架通过接收用户输入、制定执行计划、观察结果并判断操作是否完成,如果不完成则计划下一步骤来协调代理需要采取的步骤。**AgentSpec**将规则强制执行添加到这个流程中。
“在执行操作前(AgentAction),**AgentSpec**评估预定义的约束以确保合规性,必要时调整代理行为。具体而言,**AgentSpec**在三个关键决策点插入:在执行操作前(AgentAction)、在操作产生观察结果后(AgentStep),以及当代理完成任务时(AgentFinish)。这些点提供了一种结构化的方式进行干预而不改变代理的核心逻辑,”论文中写道。
更可靠的代理
像**AgentSpec**这样的方法凸显了企业在使用代理时对可靠性的需求。随着组织开始制定代理战略,技术决策者也在探索确保可靠性的方法。对于许多人来说,代理最终将自主地和主动地为用户提供任务。环境代理的概念,即AI代理和应用程序在后台持续运行并触发自身执行操作,将需要不偏离路径并且不会意外引入非安全操作的代理。如果环境代理是未来代理AI的发展方向,预计会有更多类似**AgentSpec**的方法出现,因为公司寻求使AI代理持续可靠。
对于许多人来说,代理最终将自主地和主动地为用户提供任务。环境代理的概念,即AI代理和应用程序在后台持续运行并触发自身执行操作,将需要不偏离路径并且不会意外引入非安全操作的代理。
**VB每日商业用例洞察**
如果你想给上司留下深刻印象,**VB每日**可以帮你实现。我们为你提供公司如何使用生成式AI的内部信息,从监管变化到实际部署,以便你能分享见解以获得最大收益。立即订阅阅读我们的隐私政策,感谢订阅。查看更多VB新闻通讯。发生错误。
(以上内容均由Ai生成)