微软发布Fara-7B,本地运行保障数据安全
快速阅读: 微软发布Fara-7B,70亿参数的本地运行智能助手,专为数据安全设计,通过视觉方式处理网页,任务成功率73.5%,效率高,支持用户隐私保护。
微软近期发布了Fara-7B,这是一款拥有70亿参数的新款计算机使用智能助手(Computer Use Agent, CUA),专为在用户设备上直接执行复杂任务而设计。Fara-7B凭借其紧凑的设计,成功克服了企业在数据安全方面的重大挑战,使用户能够自动化处理敏感工作流程,例如管理内部账户或处理公司机密数据,而这些信息无需离开设备。
Fara-7B的工作原理是通过视觉方式识别网页,如同人类使用鼠标和键盘一般。该模型通过屏幕截图来感知网页,并预测特定坐标以执行点击、输入和滚动等操作。与依赖“可访问性树”的系统不同,Fara-7B完全依靠像素级的视觉数据,即使面对复杂或混淆的网页代码也能有效互动。
在性能测试中,Fara-7B在WebVoyager这一标准基准上达到了73.5%的任务成功率,超过了资源消耗更高的系统,如GPT-4o(65.1%)和本土的UI-TARS-1.5-7B(66.4%)。此外,Fara-7B的效率也非常显著,平均只需约16个步骤即可完成任务,而UI-TARS-1.5-7B大约需要41个步骤。
虽然Fara-7B的发布令人期待,但也存在与其他AI模型相同的潜在风险,如可能发生的误判和在复杂指令下的执行错误。为解决这些问题,Fara-7B经过训练,能够在需要用户个人数据或同意的关键时刻暂停并请求用户确认,从而避免不可逆的操作。微软研究团队还设计了一种名为Magentic-UI的用户界面,旨在平衡关键点和用户体验,以减轻用户疲劳。
Fara-7B的开发也体现了知识蒸馏的趋势,即将复杂系统的能力压缩到更高效的小模型中。未来版本的目标是使模型更加智能化,而不是简单地增加规模,并探索在实时沙盒环境中通过强化学习进行学习的可能性。
微软已在Hugging Face和Microsoft Foundry上提供了Fara-7B的MIT许可版本,供用户实验和原型开发,但目前还不适用于关键任务的直接部署。
重点提示:🌟 Fara-7B是一款本地运行的计算机智能助手,侧重于数据安全和隐私保护。⚙️ 该模型通过视觉方式处理网页,提供更加直观的用户交互体验,效率远超其他大型模型。🛡️ Fara-7B具备“关键点”识别功能,确保用户在执行重要操作前获得确认,提高安全性。
(以上内容均由Ai生成)