AI

Salesforce联手南加大推出CoAct-1,以代码+GUI创新方法引领AI代理自动化潮流

发布时间:2025年8月13日    来源:szf
Salesforce联手南加大推出CoAct-1,以代码+GUI创新方法引领AI代理自动化潮流

快速阅读: Salesforce与南加州大学联合开发CoAct-1系统,结合编码和GUI操作优势,提升AI代理执行复杂任务能力,成功率达60.76%,效率更高,适用于客户支持、销售勘探等多领域。

Salesforce与南加州大学的研究人员共同开发了一项名为 CoAct-1 的突破性技术,旨在通过结合编码和图形用户界面(GUI)操作的优势,显著提升AI代理在计算机上执行复杂任务的能力。这一混合方法旨在克服传统GUI代理的脆弱性,为更强大、可扩展的自动化铺平道路。

传统AI代理的痛点:长任务与误点击 现有的计算机AI代理通常依赖视觉语言模型(VLM)来感知屏幕并模拟鼠标键盘操作。虽然这类“点击式”代理能执行各种任务,但在面对办公生产力套件等具有密集菜单和复杂工作流程的应用时,它们往往表现不佳。研究人员指出,在这些场景中,单一的误点击或对UI元素的误解,都可能导致整个任务失败。

为了应对这一挑战,研究人员曾尝试利用 高级 规划器来增强GUI代理,但这种方法依然无法解决那些通过几行代码就能更直接、更可靠地完成的操作。

CoAct-1:一个多智能体协作的混合系统 为解决这些限制,CoAct-1系统应运而生。其核心理念是“将GUI操作的直观优势与通过代码直接进行系统交互的精确性、可靠性和效率相结合”。该系统由一个由三个专门代理组成的团队协作完成任务: 编排器(Orchestrator) :作为中央规划器,它负责将用户的总体目标分解为子任务,并分配给最合适的代理。

程序员(Programmer) :负责编写和执行Python或Bash脚本,处理文件管理或数据处理等后端操作。

GUI 操作员(GUI Operator) :基于VLM,专门处理需要点击按钮或导航界面的前端任务。

这种动态委托机制使得CoAct-1能够策略性地绕过低效的GUI操作,转而采用更稳健、更高效的代码执行,同时保留视觉交互的必要性。整个工作流程是迭代的,每个代理完成子任务后都会向编排器汇报,由其决定下一步行动。

性能飞跃:更快、更高效 研究人员在 OSWorld 基准测试上对CoAct-1进行了测试,该基准包含了369个跨浏览器、IDE和办公应用程序的实际任务。结果显示,CoAct-1取得了 60.76%的成功率 ,树立了新的 最高 水平。

尤其是在操作系统级任务和多应用程序工作流中,CoAct-1的性能提升最为显著。更重要的是,该系统的效率也大幅提高,平均只需 10.15步 即可完成任务,远少于其他领先的纯GUI代理所需的15.22步。研究人员指出,更少的步骤不仅能加快任务完成速度,还能 最大 限度地减少出错的机会,从而实现更高效、更可靠的自动化。

从实验室走向企业:潜在的应用与挑战 这项技术拥有巨大的企业应用潜力。Salesforce应用AI研究总监 Ran Xu 指出,客户支持、销售勘探、自动化簿记和营销活动管理等领域都是完美的用例。在这些场景中,企业需要处理有API和无API的多种工具,而CoAct-1能够灵活利用代码和屏幕,提供全面的自动化解决方案。

然而,将CoAct-1从实验室推向企业环境也面临挑战,包括应对遗留软件、确保安全性和人工监督的必要性。徐强调,需要通过在沙盒环境中训练来提高代理的适应性,并建立强大的访问控制和安全护栏,以防止恶意代码执行。最终,在可预见的未来, “人在环”(human-in-the-loop) 的模式将是确保代理安全、可靠运行的关键。

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日