上海交大发佈MobiAgent:打造个性化AI助手,超越GPT-5
快速阅读: 上海交大IPADS团队发布MobiAgent,打破个人化AI助手开发壁垒,性能优于GPT-5等模型。该工具链支持用户自建移动端智能体,涵盖数据收集、模型训练及部署全流程,开源特性促进移动智能体生态发展。
近日,上海交通大学IPADS实验室团队推出了一款名为MobiAgent的移动端智能体工具链,打破了个人化智能助手的开发障碍,宣称其在真实场景中的表现优于GPT-5及其他顶级闭源模型。MobiAgent的问世,使每个人都有机会打造属于自己的AI助手。该工具链支持用户从零开始构建移动端智能体,涵盖从收集操作数据、训练模型到部署至手机的全过程。由于MobiAgent是开源的,用户能够自主获取数据、训练模型,并在个人设备上实现智能助手的功能。
为了检验MobiAgent的实际效能,研究团队在国内20款热门应用中进行了测试。结果显示,7B规模的MobiAgent模型在任务完成评分上,不仅超越了多款知名闭源大模型,在同规模的开源GUI智能体中也居于领先地位。MobiAgent独特的“潜记忆加速器”功能,通过学习历史操作,帮助智能体快速完成重复任务,性能提升可达2-3倍。
MobiAgent的核心优势在于高效的数据收集和智能训练流程。它通过轻量级工具记录用户的手机操作,利用通用VLM模型生成高质量的训练数据。这些数据经过精细调整,确保训练出的智能体具备优秀的泛化能力。MobiAgent的“大脑”由三部分组成:负责任务规划的“规划师”、依据当前屏幕作出决策的“决策者”以及执行具体操作的“执行者”。这种架构设计使模型训练更为高效,反应速度显著提高。
借助创新的AgentRR加速框架,MobiAgent能够利用过往的操作经验,大幅提高重复任务的执行效率,最高可实现60%-85%的动作复用率。这使得智能助手在处理日常事务时更加迅速、精准。MobiAgent的推出不仅简化了个人智能助手的定制过程,还促进了整个移动智能体生态的发展,预示着“能动口就不动手”的智能时代即将来临。
(以上内容均由Ai生成)