马努斯狂热来了:中国的“总代理”是本周的“人工智能的未来”和 OpenAI 杀手

发布时间:2025年3月10日    来源:szf
马努斯狂热来了:中国的“总代理”是本周的“人工智能的未来”和 OpenAI 杀手

快速阅读: 《The Register》消息,中国初创公司莫妮卡科技推出名为“曼努斯”的人工智能服务,号称比西方产品更先进。它可以高速完成多项任务,如推荐求职者、生成房产报告和股票分析。然而,也有报告指出其性能不稳定和输出质量参差。尽管如此,投资者仍对大规模人工智能投资持谨慎态度。

中国的研究人员再次因其人工智能实力成为热门话题。上周,一家名为莫妮卡科技的初创公司公布了一款名为“曼努斯”的服务,这是一种他们宣传为“通用代理”的技术,可能比西方公司的工具更胜一筹。“曼努斯”被比作开放人工智能的深度研究,该研究在网络上广泛搜集信息并整合成文档。开放人工智能声称这些文档“半小时内就能生成一份达到分析师级别的工作”。另一个参考点是安特罗皮克公司的计算机使用API和开放人工智能的操作员代理,这两者都可以通过网络浏览器执行基本任务,例如填写表格和使用电子商务网站。据称,“曼努斯”不仅能做这些事情,而且可能更快——根据其自身的基准测试。

一段发布的视频展示了“曼努斯”以超高速完成三项任务:在阅读、打开和分析求职申请后,推荐最佳候选人,并将排名写入文档。随后,在收到提示后,将其建议重新格式化为电子表格。在用户提供预算、需求和期望位置等信息后,准备了一份关于可选房产的报告。报告包括可用房源信息以及周边设施详情。此外,进行了不同股票的相关性分析,撰写了包含结论的文档,并创建了一个交互式网站,供用户探索从网页上抓取的数据。

“曼努斯”提供了一个熟悉的聊天机器人界面,用户可以在空白文本框中输入指令。早期测试者描述使用“曼努斯”的感觉像是与坐在键盘前的人合作,这个人能以惊人的速度将模糊的指示转化为精确的输出。该服务运行在“曼努斯的电脑”上,这似乎是一个云端的Ubuntu工作站。发布的视频声明,该服务“作为一个由多个独立模型驱动的多代理系统”运作,其中一些模型将在今年晚些时候开源。

演示显示,该工作站能够自行编写命令并访问各类网站,然后生成文档及用于生成文档的完整代码。《登记报》对某些结果表示不满。莫妮卡科技创建的一个类似马里奥的游戏演示粗糙且崩溃了。一个为期两个月的旅行计划,目的地包括“澳大利亚、新西兰、阿根廷(以及其他南美地区)和南极洲”,仅引用了17个来源,并且建议乘坐“豪华航班”只需双倍于经济舱的价格,而商务舱通常至少要三倍于经济舱的价格。这个旅行计划也没有提供承诺的完整下载内容,并对在澳大利亚度过一个月的旅行计划提出了奇怪的建议:谁会在一个月内不访问悉尼,却选择在冬季去塔斯马尼亚并在内陆地区度过一周,而那里的大部分地方最多只需三天时间?

我们已经看到一些关于性能缓慢和输出不满意的报告。但我们也发现了很多测试者报告说,该工具一次可以打开50个浏览器窗口来获取数据,然后迅速分析这些信息。开发者对其编码能力表示赞叹。“深搜”并不是唯一让开放人工智能及其伙伴担心的中国大型语言模型制造商。对吧,阿里巴巴?

中国推出了人工智能,用于为官员撰写政治正确的文件。百度推出了免费聊天机器人,而阿里则获得了苹果的合作。美国参议员提议对任何帮助中国人工智能发展的行为处以监禁和100万美元罚款。我们看到许多评论抓住“莫妮卡科技”使用的“通用代理”这一术语,并由此描述“曼努斯”是迈向通用人工智能的一步——即软件能够以人类或超人类水平的技能完成任务。“深搜”2.0?更像是“深叹”。

我们也看到许多评论认为“曼努斯”代表了像中国初创公司“深搜”那样的性能飞跃,该公司创建了一个聊天机器人,生成了出色的结果,并被认为需要的计算资源远少于竞争对手的服务。这种假设引发了恐慌,因为人们认为尽管有出口禁令,中国人工智能公司依然超越了所有竞争对手。投资者也因考虑超大规模企业的计划大规模人工智能基础设施投资而感到不安,担心这可能是不必要的,因此难以收回投资。

最终,这两种恐慌的原因都被揭穿了。“深搜”被发现存在严重的安全问题,被多个国家政府禁止,并且夸大了其声称仅需少量硬件资源的说法。它还存在偏见:那些暗示中国共产党负面形象的提示会产生错误。超大规模企业告诉投资者不必担心,因为他们正在建设推理基础设施,并预计这将成为未来几个月和几年内几乎所有应用的一部分(并且提高了依赖其服务的应用程序的价格)。

《登记报》已申请加入该邀请制服务,并希望被接受以便在未来几天内提供实际体验评估。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日