提高代理可靠性的新方法 AgentSpec 强制代理遵循规则

发布时间:2025年3月29日    来源:szf
提高代理可靠性的新方法 AgentSpec 强制代理遵循规则

快速阅读: 据《VentureBeat 公司》称,研究团队推出AgentSpec系统,旨在提高基于大语言模型(LLM)的AI代理可靠性。AgentSpec通过定义触发器、条件和强制机制来限制代理操作范围。测试显示,该系统显著减少了不安全行为,并适用于多种框架。专家认为,随着自主代理的普及,类似工具的需求将持续增长。

订阅我们的每日和每周简报,获取行业领先的人工智能报道的最新动态和独家内容。点击了解更多信息。

人工智能代理存在安全性与可靠性问题。尽管这些代理能够帮助企业自动化更多的工作流程步骤,但在执行任务时可能会采取意想不到的行动,不够灵活且难以控制。组织已对不可靠的代理发出警告,担心一旦部署,代理可能会忘记遵循指令。甚至承认要确保代理可靠性,需要与外部开发人员合作,因此它开放了其代理软件开发工具包(SDK)以帮助解决这个问题。然而,新加坡管理大学(SMU)的研究人员已经开发出一种新的方法来解决代理可靠性问题。

**AgentSpec** 是一种特定领域的框架系统,允许用户“定义包含触发器、谓词和强制机制的结构化规则”。研究人员表示,AgentSpec 将使代理仅在用户希望的参数范围内工作。

用新方法引导基于LLM的代理
**AgentSpec** 并不是一个新的大型语言模型(LLM),而是一种引导基于LLM的AI代理的方法。研究人员相信,AgentSpec 不仅可以在企业环境中用于代理,还可以用于自动驾驶应用程序。

第一个集成在LangChain框架上的AgentSpec测试显示,但研究人员表示他们设计它是框架无关的,这意味着它也可以在AutoGen和Apollo等生态系统上运行。使用AgentSpec的实验表明,它防止了“超过90%的不安全代码执行,确保了在自动驾驶违规场景下的完全合规性,消除了具身代理任务中的危险行为,并以毫秒级的开销运行。”

使用OpenAI的o1生成的AgentSpec规则也表现出色,强制执行了87%的高风险代码,并在8个场景中的5个中防止了违法行为。

当前方法略显不足
**AgentSpec** 并不是唯一帮助开发者为代理带来更多控制和可靠性的方法。其中一些方法包括ToolEmu和GuardAgent。初创公司Galileo推出了确保代理按预期工作的解决方案,这是一种确保代理按预期工作的方法。开源平台H2O.ai 利用预测模型使金融、医疗、电信和政府公司的代理更加准确。

研究AgentSpec的研究人员表示,当前缓解风险的方法(如ToolEmu)有效地识别风险。他们指出,“这些方法缺乏可解释性,没有提供安全强制机制,使其容易受到对抗性操纵。”

使用AgentSpec
**AgentSpec** 作为代理的运行时强制层工作。它拦截代理在执行任务时的行为,并添加由人类定义或由提示生成的安全规则。由于**AgentSpec**是一种定制的领域特定语言,用户需要定义安全规则。这有三个组成部分:首先是触发器,确定何时激活规则;其次是检查条件并强制执行如果违反规则应采取的操作。

虽然如前所述,**AgentSpec**是基于LangChain构建的,但研究人员表示,**AgentSpec**也可以集成到其他框架中,例如AutoGen或自动驾驶汽车软件堆栈Apollo。这些框架通过接收用户输入、制定执行计划、观察结果并判断操作是否完成,如果不完成则计划下一步骤来协调代理需要采取的步骤。**AgentSpec**将规则强制执行添加到这个流程中。

“在执行操作前(AgentAction),**AgentSpec**评估预定义的约束以确保合规性,必要时调整代理行为。具体而言,**AgentSpec**在三个关键决策点插入:在执行操作前(AgentAction)、在操作产生观察结果后(AgentStep),以及当代理完成任务时(AgentFinish)。这些点提供了一种结构化的方式进行干预而不改变代理的核心逻辑,”论文中写道。

更可靠的代理
像**AgentSpec**这样的方法凸显了企业在使用代理时对可靠性的需求。随着组织开始制定代理战略,技术决策者也在探索确保可靠性的方法。对于许多人来说,代理最终将自主地和主动地为用户提供任务。环境代理的概念,即AI代理和应用程序在后台持续运行并触发自身执行操作,将需要不偏离路径并且不会意外引入非安全操作的代理。如果环境代理是未来代理AI的发展方向,预计会有更多类似**AgentSpec**的方法出现,因为公司寻求使AI代理持续可靠。

对于许多人来说,代理最终将自主地和主动地为用户提供任务。环境代理的概念,即AI代理和应用程序在后台持续运行并触发自身执行操作,将需要不偏离路径并且不会意外引入非安全操作的代理。

**VB每日商业用例洞察**
如果你想给上司留下深刻印象,**VB每日**可以帮你实现。我们为你提供公司如何使用生成式AI的内部信息,从监管变化到实际部署,以便你能分享见解以获得最大收益。立即订阅阅读我们的隐私政策,感谢订阅。查看更多VB新闻通讯。发生错误。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日