AI 领域的每个人都在谈论 Manus。我们对其进行了测试。
快速阅读: 据《麻省理工学院科技评论》称,曼努斯在执行搜索任务时耗时较长,尤其是在尝试访问付费内容时遇到障碍。尽管如此,它仍能生成部分候选名单,但在全面性和代表性方面存在不足。总体而言,曼努斯对无编程背景的用户友好,适用于需要广泛互联网研究的任务,但效率较低。
开发搜索策略是曼努斯最耗时的部分。虽然没有明确说明其方法,但曼努斯的计算机窗口显示代理迅速浏览了知名研究型大学的网站、科技奖项公告和新闻文章。然而,在尝试访问学术论文和付费媒体内容时,它再次遇到了障碍。经过三小时的网上搜索——期间曼努斯(可以理解地)多次问我能否缩小搜索范围——它只给了我三个带有完整背景资料的候选人。当我再次要求它提供完整的五十人名单时,它最终生成了一个名单,某些学术机构和领域严重过代表,反映出研究过程不够全面。在我指出问题并要求它从中国找出五个候选人后,它成功编译了一个五人名单,尽管结果偏向于中国媒体关注的对象。由于系统警告,如果我继续输入大量文本,曼努斯的性能可能会下降,所以我只好放弃了。
我的评估:总体而言,我发现曼努斯是一个高度直观的工具,适合有或没有编程背景的用户。在三项任务中的两项中,它的表现优于我将相同任务交给ChatGPT DeepResearch时的表现,尽管完成这些任务花费的时间要长得多。曼努斯在需要广泛开放互联网研究且范围有限的分析任务上似乎最为合适。换句话说,最好坚持那些熟练的人类实习生在一天工作中能够完成的任务。
(以上内容均由Ai生成)