特斯拉前AI总监卡帕西:AGI成熟还需十年

发布时间:2025年10月20日    来源:szf
特斯拉前AI总监卡帕西:AGI成熟还需十年

快速阅读: OpenAI创始成员安德烈·卡帕西指出,当前AI Agent技术存在无法持续学习、非真正多模态、操作电脑能力差等缺陷,实现实用化还需十年。

2025年被称为智能体Agent之年,当行业的热潮席卷全球之际,OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)近日在接受播客节目“Dwarkesh Patel Show”采访时给这股热潮泼下一盆冷水,他直言,当前AI Agent技术尚处早期,还存在“无法持续学习、非真正的多模态、不能自如操作电脑”等核心缺陷,要实现真正的实用化还需要十年左右。

OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)近日在接受播客节目采访。

AGI为何还需要十年 卡帕西认为,尽管当前大语言模型展现出令人惊叹的能力,但Agent真正能够使用的标志是它成为一个员工或实习生,人类愿意雇佣它和自己一起干活、工作。显然,Agent当前还做不到这一步。

原因在于Agent还存在三大核心缺陷:无法持续学习、非真正的多模态、不能自如操作电脑。现在的AI无法记住和用户的每一次互动,当关掉对话窗口后,它就会忘掉。它无法像人类一样,通过日常经历持续学习巩固。

AI虽然能看图写字,但无法真正理解并完成复杂任务。卡帕西举例,AI能写代码,但无法制作一张精美的PPT,因为超出了本质是文本处理器的能力范围。同时,AI操作电脑、点击软件的能力还非常初级和不可靠。

卡帕西借用其在特斯拉开发自动驾驶的经验提出,从“演示”到“产品”有着巨大的鸿沟,“这是一场向数字‘9’的进军,一个在90%的情况下能工作的演示达成了第一个9,但要达到99.99999%的可靠性,还有更多的‘9’需要走。这就是为什么这些事情要花这么长时间。” 强化学习很糟糕 谈及强化学习(Reinforcement Learning),卡帕西直言,“强化学习很糟糕,只是碰巧之前的其他方法更糟糕。” 在强化学习中,试图找到一个问题的解决方案,AI可能会进行数百种不同的尝试。“就像做选择题,它蒙了100次,只有最后1次对了,但它会把整个蒙题过程都当成‘正确经验’,这种学习方式存在严重的效率问题。而人类永远不会这样做。”其中的原因是第一,现实世界人类不会进行数百次试运行;第二,当人类找到解决方案时,会有一个相当复杂的反思复盘过程。

另一个深层问题是模型坍塌(model collapse)。模型生成的内容多样性会悄然减少,分布范围变窄,即使单个输出看起来仍然合理。卡帕西举例,你可以让 ChatGPT讲个笑话,但它反复输出的可能只是少数几个模式化的笑话。这一特性阻碍了AI实现持续学习,而如果让AI使用自己产出的数据,就会导致模型在自有数据上产生更加同质化的内容,陷入恶性循坏。

虽然人类也会存在类似的思维定式,但可以通过交流、阅读等方式来对抗这一趋势。儿童之所以是高效的学习者,正因为他们不擅长记忆,反而被迫去发现通用模式。当前AI缺乏这种主动寻求并整合多样性的内在机制,必须依赖人类产生的真实数据,这是个很大的瓶颈。

但卡帕西同时也深刻认识到,强化学习仍是当前AI发展道路上不可或缺的一环。原因在于,传统的监督学习(Supervised Learning)存在明显的天花板。监督学习严重依赖大量、高质量的标注数据。但对于“好代码”、“好决策”这类无法明确定义、无法通过标注数据学习的概念,只能通过设计一个奖励函数来让模型自己摸索什么是“好”。这正是强化学习的应用场景。

AGI的渐进式路径 卡帕西坚持AGI的早期定义——能执行任何具有经济价值任务的人类水平系统。但目前AI的实际影响仍有限,其应用高度集中在编码等高度结构化、文本驱动的领域。“人们把物理的东西都拿走了,只是在讨论数字知识工作,这是一个相当重大的让步。原始定义是人类可以做的任何任务,包括举起一件东西。” 与很多人对AGI“奇点”时刻的想象不同,卡帕西认为,AGI不会在某一天突然降临并引爆智能爆炸,而是会像蒸汽机、电力和互联网等历史上的通用技术一样,缓慢地融入并延续过去2.5个世纪来约2%的年度GDP增长趋势。

卡帕西一直试图在GDP(Gross Domestic Product,国内生产总值)的增长趋势中找到AI对其产生的明显影响,理论上GDP应该显著上升。“但后来我看了一些我认为非常具有变革性的其他技术,比如计算机或移动电话等。你在GDP中找不到它们,GDP是同样的指数。” 他进一步举例,即使人们认为2008年iPhone 推出是个重大的地震式变化,而实际上不是,一切都如此分散、如此缓慢地扩散,以至于一切最终都被平均到同样的指数中。

这种渐进性源于技术革命的本质:新技术从演示到成熟产品的扩散需要时间。就像自动驾驶关于一场向数字“‘9’的进军”,每一个“9”的可靠性提升都需要付出巨大努力。AGI的发展同样会遵循这条路径,先自动化一些封闭、结构化的任务,再逐步攻克更复杂的工作,其间社会需要时间来调整基础设施、法律和技能体系。

卡帕西相信未来将会是多个AI实体逐渐增强自主性,与人类社会协同演进。因此人们拥有宝贵的窗口期进行准备,可以系统地调整教育、社会保障和法律法规,以确保人类在AGI时代能够持续繁荣。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日