卡帕西发布GPT-5 Pro新指南,称其为AI编程最后防线
快速阅读: Karpathy 分享 AI 辅助编程体验,强调在代码后稀缺时代,写与删的价值需重新审视。Cursor、Claude Code、Codex 和 GPT-5 Pro 各有优劣,适应不同编程需求。
在“代码后稀缺时代”,Karpathy 分享了他对 AI 辅助编程的最新体会。他认为,在代码可以低成本生成并随时丢弃的背景下,“写”与“删”的价值正被重新审视。Cursor 补全适用于日常开发,Claude Code 和 Codex 能完成大块功能但缺乏“品味”,而 GPT-5 Pro 则是攻克顽固 bug 的终极防线。
Karpathy 发布了最新的“AI 编程指南”。在当前模型能力已经达到博士级的情况下,如何最大化 AI 对编程的帮助?当 AI 能够“低成本生成代码”,只需“凭感觉编程”时,一个新的问题出现了:现在是会写代码更重要,还是会删代码更重要?
Karpathy 分享了他的“最佳 LLM 辅助编程”体验和方法。首先,要建立一种理念:工具是为人服务的。不执着于单一“完美”工具,而是倾向于整合多个工作流,取长补短。不同工具在不同层级的任务中各有优势。例如,Claude Code 和 Codex 适合大段难度不高的任务,Tab 补全则需要人类先“打好样”。
Cursor 是 Karpathy 日常工作的主要使用方式,占比约 75%。在正确的位置写代码块或注释,能高效传达任务规范。这种“人类先写的方式”信息传递效率高于自然语言对话。但频繁开关 Tab 自动补全以避免干扰是个问题。更高一级的用法是,高亮具体代码块,然后进行某些修改。
对于重型工具,如 Claude Code 和 Codex,可以用于实现大块、可直接描述的功能。但这种“自动驾驶”模式整体表现参差不齐,容易偏离需求,经常需要手动中断以避免错误输出。Karpathy 还未学会如何通过并行使用多个实例来提高效率,仅使用一个就已经感觉很吃力。此外,他还未找到好办法维护 CLAUDE.md 文件,经常需要专门对代码风格或个人偏好的“代码品味”问题进行一轮“净化”。这些工具写的代码防御性过强,经常滥用 try/catch;抽象过于复杂;代码臃肿,喜欢用嵌套的 if-then-else 结构;重复代码块,而不是创建一个好用的辅助函数。总之,这些工具虽然能完成任务,但缺乏“优美”代码的“品味”。
当 Karpathy 涉足不太熟悉的领域时,这些工具变得不可或缺。例如,最近编写的一些 Rust 和 SQL 命令,或其他之前涉猎较少的技术。他还尝试让 Claude Code 在写代码的同时教他知识,但完全行不通——AI 只想埋头写代码,不愿意在过程中进行解释。此外,在处理低风险的一次性定制化、实用工具或调试代码时,这些工具非常有用。例如,为了定位一个特定的 bug,Claude Code 可以一口气写出 1000 行一次性、极其详尽的可视化代码,等找到 bug 后,这些代码就被删除了。
在“代码后稀缺时代”,代码可以快速生成和丢弃,写代码的门槛降低,代码不再是稀缺资源。工具使得探索性和实验性编程成为可能。Karpathy 感觉编程领域充满无限可能性,但也为此感到焦虑,担心自己跟不上技术前沿。
面对最困难的问题,GPT-5 Pro 是最后的防线。只有 GPT-5 Pro 能定位其他工具无法解决的微妙 bug,处理最硬核的问题。例如,Karpathy 曾多次遇到这种情况:他、Cursor 和 Claude Code 三个加起来被一个 bug 卡住,但将所有内容复制粘贴给 GPT-5 Pro 后,它成功找到了极其微妙的 bug。GPT-5 Pro 还能挖掘各种生僻的文档和论文,提供相关优质资源和线索。
在众多编程“范式”和各有优劣的工具加持下,Karpathy 感觉编程领域充满无限可能性。评论区引发了热烈讨论,有人分享了如何更新 CLAUDE.md 文件的方法,还有人建议将 Claude Code 得到的代码再交给 GPT-5 来“润色一番”。有人分享了自己的 AI 编程工具使用流程,还有人分享了常用的开发工具。大家一致认为,在不同任务上选择合适的模型是一种艺术。你目前使用 AI 编程的体验如何?欢迎在评论区分享。
(以上内容均由Ai生成)