AI

阿里巴巴Qwen团队发布Mobile-Agent-v3和GUI-Owl,推进GUI自动化

发布时间:2025年9月1日    来源:szf
阿里巴巴Qwen团队发布Mobile-Agent-v3和GUI-Owl,推进GUI自动化

快速阅读: 阿里巴巴Qwen团队推出GUI-Owl和Mobile-Agent-v3,解决GUI自动化挑战,提升任务理解和执行能力,适用于复杂多变的现实环境,增强跨平台任务完成效率。

近日,阿里巴巴Qwen团队推出了两款革命性产品——Mobile-Agent-v3和GUI-Owl,旨在解决图形用户界面(GUI)自动化中的一系列挑战。

现代计算设备普遍采用图形用户界面,而传统的自动化方法通常依赖复杂的脚本和手工规则,效果并不理想。GUI-Owl作为一款新型多模态代理模型,基于Qwen2.5-VL构建,并在大量GUI交互数据上进行了后续训练,旨在提升任务理解和执行的能力。

GUI-Owl的设计初衷是应对真实世界中GUI环境的多样性和动态性。通过整合感知、推理、规划和执行能力,它提供了一个统一的政策网络。这种设计使它能够在复杂的任务中进行多轮决策,同时实现清晰的推理过程,适应实际使用中的变化。

为确保高质量的数据支持,团队开发了一个自我演化的数据生产管道。该管道生成真实应用程序的导航流程,并通过人工标注进行验证,确保生成数据的真实性和有效性。此外,团队还使用了多种数据合成策略,以丰富模型的学习内容,增强其在任务执行时的适应性和灵活性。

Mobile-Agent-v3框架则侧重于多代理的协作,将复杂任务分解为子目标,通过动态更新计划来处理执行反馈。框架中的四个专业代理——经理代理、工作代理、反思代理和笔记代理——各司其职,提升了任务执行的效率和成功率。经过多轮测试和评估,GUI-Owl和Mobile-Agent-v3在多个GUI自动化基准上表现出色,特别是在跨平台的任务完成能力方面。

这些创新工具的发布标志着阿里巴巴在通用GUI自动化领域取得的重大进展,未来将为更广泛的应用场景提供更强大的技术支持。

(以上内容均由Ai生成)

你可能还想读

韩半导体出口创纪录,AI芯片繁荣掩盖改革风险

韩半导体出口创纪录,AI芯片繁荣掩盖改革风险

快速阅读: 韩国今年半导体出口预计超1650亿美元,前九月已达1197亿美元,同比增长17%,占总出口23%。增长因人工智能服务器需求和内存价格上涨,在全球经济放缓中展现韧性。 据韩国贸易、工业和资源部本周消息,今年韩国半导体出口预计将达到 […]

发布时间:2025年10月24日
纽约消防局启用AI摄像头,提前预警森林火灾

纽约消防局启用AI摄像头,提前预警森林火灾

快速阅读: 纽约市消防局推出太阳能驱动、AI支持的烟雾检测摄像头,可在火势蔓延前及时发现火灾,计划扩展至五个行政区,增强早期预警能力,保护高风险区域安全。 纽约市消防局(FDNY)的灌木火灾特遣队最近推出了最新的太阳能驱动、人工智能支持的烟 […]

发布时间:2025年10月24日
谷歌云TPU助力Anthropic扩大Claude训练规模

谷歌云TPU助力Anthropic扩大Claude训练规模

快速阅读: Anthropic与Google深化合作,扩大计算能力,支持Claude满足快速增长的客户需求,巩固行业领先位置。 Anthropic 和 Google 有着长期的合作关系,此次合作的进一步扩展将帮助我们继续扩大所需的计算能力, […]

发布时间:2025年10月24日
中兴呼吁重耦合计算与网络,推动AI可持续发展

中兴呼吁重耦合计算与网络,推动AI可持续发展

快速阅读: 中兴通讯CEO徐子阳呼吁电信与计算行业重新耦合,以适应AI需求增长,提出AI Core战略,展示多款支持AI的产品,强调可持续发展与成本控制,与泰国AIS合作提升网络效率。 近年来,电信和计算行业纷纷采取解耦策略,通过技术与产品 […]

发布时间:2025年10月24日
微软推出新AI角色Mico,赋予Copilot虚拟助手新面貌

微软推出新AI角色Mico,赋予Copilot虚拟助手新面貌

快速阅读: 微软推出新AI角色Mico,作为Copilot虚拟助手的化身,旨在为AI聊天机器人增添个性,同时保持友好而不谄媚的形象,通过表情和动作响应用户情绪,目前仅限美国用户使用。 近三十年前令微软Office用户感到厌烦的动画纸夹Cli […]

发布时间:2025年10月24日
英特尔Q3营收137亿美元,同比增长3%成功扭亏为盈

英特尔Q3营收137亿美元,同比增长3%成功扭亏为盈

快速阅读: 英特尔公布2025年第三季度财报,营收137亿美元,同比增长3%,毛利率达38.2%。各业务部门表现不一,CCG营收增长5%,DCAI和代工业务略有下降。期间获多笔重大投资,推进技术创新和市场扩展。 感谢IT之家网友HH_KK、 […]

发布时间:2025年10月24日
微软推出AI伴侣Mico,致敬经典Clippy大眼夹

微软推出AI伴侣Mico,致敬经典Clippy大眼夹

快速阅读: 微软推出AI聊天机器人Mico,具有表情丰富的头像,能倾听互动并根据用户操作变换颜色。首次在美国、加拿大和英国推出,支持“Learn Live”模式,旨在加深人际联系。 10 月 24 日消息,北京时间今天凌晨,微软推出了一款名 […]

发布时间:2025年10月24日
英特尔107制程产能紧张,AI PC出货预期不变

英特尔107制程产能紧张,AI PC出货预期不变

快速阅读: 英特尔在2025Q3财报电话会议中宣布,Intel 10/7制程节点供应紧张,尽管第三季度晶圆交付量超出预期,仍无法满足客户需求。英特尔计划利用现有库存并引导客户转向其他产品,预计2026年一季度供应更紧。同时,英特尔维持年底前 […]

发布时间:2025年10月24日