微软发布Fara-7B，本地运行保障数据安全

发布时间：2025年11月25日来源：szf

快速阅读: 微软发布Fara-7B，70亿参数的本地运行智能助手，专为数据安全设计，通过视觉方式处理网页，任务成功率73.5%，效率高，支持用户隐私保护。

微软近期发布了Fara-7B，这是一款拥有70亿参数的新款计算机使用智能助手（Computer Use Agent, CUA），专为在用户设备上直接执行复杂任务而设计。Fara-7B凭借其紧凑的设计，成功克服了企业在数据安全方面的重大挑战，使用户能够自动化处理敏感工作流程，例如管理内部账户或处理公司机密数据，而这些信息无需离开设备。

Fara-7B的工作原理是通过视觉方式识别网页，如同人类使用鼠标和键盘一般。该模型通过屏幕截图来感知网页，并预测特定坐标以执行点击、输入和滚动等操作。与依赖“可访问性树”的系统不同，Fara-7B完全依靠像素级的视觉数据，即使面对复杂或混淆的网页代码也能有效互动。

在性能测试中，Fara-7B在WebVoyager这一标准基准上达到了73.5%的任务成功率，超过了资源消耗更高的系统，如GPT-4o（65.1%）和本土的UI-TARS-1.5-7B（66.4%）。此外，Fara-7B的效率也非常显著，平均只需约16个步骤即可完成任务，而UI-TARS-1.5-7B大约需要41个步骤。

虽然Fara-7B的发布令人期待，但也存在与其他AI模型相同的潜在风险，如可能发生的误判和在复杂指令下的执行错误。为解决这些问题，Fara-7B经过训练，能够在需要用户个人数据或同意的关键时刻暂停并请求用户确认，从而避免不可逆的操作。微软研究团队还设计了一种名为Magentic-UI的用户界面，旨在平衡关键点和用户体验，以减轻用户疲劳。

Fara-7B的开发也体现了知识蒸馏的趋势，即将复杂系统的能力压缩到更高效的小模型中。未来版本的目标是使模型更加智能化，而不是简单地增加规模，并探索在实时沙盒环境中通过强化学习进行学习的可能性。

微软已在Hugging Face和Microsoft Foundry上提供了Fara-7B的MIT许可版本，供用户实验和原型开发，但目前还不适用于关键任务的直接部署。

重点提示：🌟 Fara-7B是一款本地运行的计算机智能助手，侧重于数据安全和隐私保护。⚙️ 该模型通过视觉方式处理网页，提供更加直观的用户交互体验，效率远超其他大型模型。🛡️ Fara-7B具备“关键点”识别功能，确保用户在执行重要操作前获得确认，提高安全性。

(以上内容均由Ai生成)