Manus 是 Anthropic 的 Claude 的包装,没关系
快速阅读: 据《印度分析杂志》称,近期,中国深圳的曼纽斯公司推出了一款被称为“通用型人工智能代理”的产品,能自主规划、执行并生成多种数据类型的结果。该产品迅速引起关注,但也因运行基于Anthropic的克劳德模型而受到质疑。尽管存在一些批评,如完成任务时间过长等问题,但其强大的功能仍获得肯定。目前,已有开发者创建了“OpenManus”这一开源替代品。
在过去几天里,人工智能生态系统中出现了一种熟悉的感觉,仿佛重现了深度研究现象,随着一家新的中国初创公司进入快速发展的人工智能代理领域。总部位于中国深圳的曼纽斯公司开发了一款他们称之为“通用型人工智能代理”。这种通用代理可以在实时浏览网站时自主规划、执行并交付完整的结果,并处理和生成多种数据类型。它还使用多种工具来交付结果。尽管曼纽斯目前仅限邀请制使用,但其能力迅速引起了轰动。门洛风投的合伙人迪迪·达斯表示:“曼纽斯,这个大家都在谈论的新人工智能产品,确实值得期待。这是我们要承诺的人工智能代理。”他强调该代理能在大约一小时内完成两周的专业工作量。科技控股公司Tiny的联合创始人安德鲁·威尔金森表示:“我觉得我好像时间旅行了六个月到未来。”他还提到他让曼纽斯为他的公司构建并替换了每年花费六千美元的软件。该公司还展示了各种功能,如创建详细的行程安排、深入的股票和企业数据分析、各种主题的研究报告、游戏设计、互动教育课程等。用户称其为深度研究工具、自主操作者、计算机使用功能及带记忆功能的编码代理的综合体。
除了曼纽斯的代理功能令人惊叹外,该平台也因其整体用户体验(UX)而受到赞誉。“用户体验是许多其他公司承诺却未能实现的,这次终于实现了。”Hugging Face的产品负责人维克多·穆斯塔尔说。
此外,曼纽斯还需要人类进行各种权限和批准的授予。曼纽斯还在GAIA基准测试中评估了其代理,该测试用于解决现实世界问题的一般人工智能助手。根据结果显示,曼纽斯的表现优于OpenAI的深度研究。来源:曼纽斯人工智能
尽管曼纽斯只是一个包装器,但它仍然值得尊重。然而,几天后,X平台上的用户发现曼纽斯基于Anthropic的克劳德模型运行。一些用户迅速表达了失望。因此,有些人甚至认为曼纽斯没有市场优势或护城河。为了实现这些功能,曼纽斯是生态中最优秀的人工智能模型的“包装器”。这种做法在社交媒体上带有奇怪的负面含义。最终,曼纽斯成功设计了一个界面,以利用基础人工智能模型的代理能力。开放AI的专业人士艾丹·麦克拉赫林在X平台上表示,他并不在乎这是否是一个包装器。“如果它创造了价值,就值得我的尊重。关注能力,而非架构。”
此外,初步评价显示,曼纽斯突显了当前人工智能模型的强大能力;即便是制造它们的实验室也无法完全释放这些能力。“曼纽斯不仅仅是在模型上添加了一个API。他们建立了一个能够执行深度研究、深度思考和多步骤任务的自主系统,这是其他人工智能无法做到的。”GitGlance.co的创始人理查森·达克姆说。
此外,如果曼纽斯是在美国现有模型的基础上构建的,为什么他们不能自己提供这些功能?“我认为每个美国实验室都有这些能力和更好的功能,但由于风险规避,尤其是监管风险,他们并未发布这些功能。”AI研究员迪恩·W·鲍尔透露。然而,在更光明的一面,曼纽斯是基于现有的大型语言模型构建的。这意味着其能力可以被复制。这在X平台上引发了用户的广泛期待,许多人希望看到一个开源版本。似乎这些愿望比预期来得更快。GitHub上的一些开发者已经创建了一个名为“OpenManus”的开源替代品。该项目现在已经在GitHub上可用。
然而,曼纽斯也受到了一些批评。用户报告称,曼纽斯完成任务所需时间过长,甚至无法完成。生物医学科学家德里亚·乌努马兹发现前者在15分钟内完成任务,而曼纽斯人工智能在第18/20步时耗时50分钟未能完成。Klick Health的生成式人工智能高级副总裁西蒙·史密斯认为这些问题可能是由于曼纽斯的基础模型不如OpenAI的深度研究好。此外,他还补充说,由于曼纽斯使用了多个模型,因此可能需要比深度研究更长时间才能生成完整的报告。另一名用户指出,曼纽斯在网页搜索时会卡顿,“代码任务中会出现中断”,并且通常速度较慢。一些用户还批评了曼纽斯的邀请制访问方式,以及如何通过社交媒体上的影响力人物来制造炒作。
考虑到曼纽斯仍处于早期阶段,它可能会改进其能力。然而,一个关键的问题仍然存在:OpenAI、Anthropic甚至谷歌多久才会推出一个更易获取的版本,以实现曼纽斯的功能?
(以上内容均由Ai生成)