马努斯狂热来了:中国的“总代理”是本周的“人工智能的未来”和 OpenAI 杀手
快速阅读: 《The Register》消息,中国初创公司莫妮卡科技推出名为“曼努斯”的人工智能服务,号称比西方产品更先进。它可以高速完成多项任务,如推荐求职者、生成房产报告和股票分析。然而,也有报告指出其性能不稳定和输出质量参差。尽管如此,投资者仍对大规模人工智能投资持谨慎态度。
中国的研究人员再次因其人工智能实力成为热门话题。上周,一家名为莫妮卡科技的初创公司公布了一款名为“曼努斯”的服务,这是一种他们宣传为“通用代理”的技术,可能比西方公司的工具更胜一筹。“曼努斯”被比作开放人工智能的深度研究,该研究在网络上广泛搜集信息并整合成文档。开放人工智能声称这些文档“半小时内就能生成一份达到分析师级别的工作”。另一个参考点是安特罗皮克公司的计算机使用API和开放人工智能的操作员代理,这两者都可以通过网络浏览器执行基本任务,例如填写表格和使用电子商务网站。据称,“曼努斯”不仅能做这些事情,而且可能更快——根据其自身的基准测试。
一段发布的视频展示了“曼努斯”以超高速完成三项任务:在阅读、打开和分析求职申请后,推荐最佳候选人,并将排名写入文档。随后,在收到提示后,将其建议重新格式化为电子表格。在用户提供预算、需求和期望位置等信息后,准备了一份关于可选房产的报告。报告包括可用房源信息以及周边设施详情。此外,进行了不同股票的相关性分析,撰写了包含结论的文档,并创建了一个交互式网站,供用户探索从网页上抓取的数据。
“曼努斯”提供了一个熟悉的聊天机器人界面,用户可以在空白文本框中输入指令。早期测试者描述使用“曼努斯”的感觉像是与坐在键盘前的人合作,这个人能以惊人的速度将模糊的指示转化为精确的输出。该服务运行在“曼努斯的电脑”上,这似乎是一个云端的Ubuntu工作站。发布的视频声明,该服务“作为一个由多个独立模型驱动的多代理系统”运作,其中一些模型将在今年晚些时候开源。
演示显示,该工作站能够自行编写命令并访问各类网站,然后生成文档及用于生成文档的完整代码。《登记报》对某些结果表示不满。莫妮卡科技创建的一个类似马里奥的游戏演示粗糙且崩溃了。一个为期两个月的旅行计划,目的地包括“澳大利亚、新西兰、阿根廷(以及其他南美地区)和南极洲”,仅引用了17个来源,并且建议乘坐“豪华航班”只需双倍于经济舱的价格,而商务舱通常至少要三倍于经济舱的价格。这个旅行计划也没有提供承诺的完整下载内容,并对在澳大利亚度过一个月的旅行计划提出了奇怪的建议:谁会在一个月内不访问悉尼,却选择在冬季去塔斯马尼亚并在内陆地区度过一周,而那里的大部分地方最多只需三天时间?
我们已经看到一些关于性能缓慢和输出不满意的报告。但我们也发现了很多测试者报告说,该工具一次可以打开50个浏览器窗口来获取数据,然后迅速分析这些信息。开发者对其编码能力表示赞叹。“深搜”并不是唯一让开放人工智能及其伙伴担心的中国大型语言模型制造商。对吧,阿里巴巴?
中国推出了人工智能,用于为官员撰写政治正确的文件。百度推出了免费聊天机器人,而阿里则获得了苹果的合作。美国参议员提议对任何帮助中国人工智能发展的行为处以监禁和100万美元罚款。我们看到许多评论抓住“莫妮卡科技”使用的“通用代理”这一术语,并由此描述“曼努斯”是迈向通用人工智能的一步——即软件能够以人类或超人类水平的技能完成任务。“深搜”2.0?更像是“深叹”。
我们也看到许多评论认为“曼努斯”代表了像中国初创公司“深搜”那样的性能飞跃,该公司创建了一个聊天机器人,生成了出色的结果,并被认为需要的计算资源远少于竞争对手的服务。这种假设引发了恐慌,因为人们认为尽管有出口禁令,中国人工智能公司依然超越了所有竞争对手。投资者也因考虑超大规模企业的计划大规模人工智能基础设施投资而感到不安,担心这可能是不必要的,因此难以收回投资。
最终,这两种恐慌的原因都被揭穿了。“深搜”被发现存在严重的安全问题,被多个国家政府禁止,并且夸大了其声称仅需少量硬件资源的说法。它还存在偏见:那些暗示中国共产党负面形象的提示会产生错误。超大规模企业告诉投资者不必担心,因为他们正在建设推理基础设施,并预计这将成为未来几个月和几年内几乎所有应用的一部分(并且提高了依赖其服务的应用程序的价格)。
《登记报》已申请加入该邀请制服务,并希望被接受以便在未来几天内提供实际体验评估。
(以上内容均由Ai生成)