过去几周大量使用 Claude 编程的一些零散笔记

编程工作流。
鉴于最近一轮大语言模型编程能力的明显跃升，和许多人一样，我在极短时间内完成了一个非常陡峭的转变：11 月时，我大概还是 80% 手写代码 + 自动补全、20% 使用代理；而到了 12 月，已经变成了 80% 代理编程、20% 编辑和修修补补。也就是说，我现在基本上是在用英语写程序了——有点不好意思地用“人话”告诉 LLM 要写什么代码。说实话，这对自尊心有点伤害，但能够以“大块代码动作”的方式操控软件，整体收益实在太高了，尤其是在你逐渐适应它、配置好它、学会如何使用它，并真正理解它能做什么、不能做什么之后。这无疑是我将近二十年编程生涯中，对基础编程工作流影响最大的一次变化，而且它是在短短几周内发生的。我预计，现在已经有相当一部分工程师（很容易达到两位数百分比）正在经历类似的转变，而这种变化在普通大众中的认知度，却仍然停留在个位数的低水平。

IDE / 代理蜂群 / 易错性。
在我看来，现在无论是“已经不需要 IDE 了”的炒作，还是“代理蜂群”的炒作，都有点言过其实。模型确实仍然会犯错，如果你在写任何你真正关心的代码，我都会建议你像鹰一样盯着它——在旁边开一个清晰、完整的 IDE。错误的类型已经发生了很大变化：不再是简单的语法错误，而是那种略显草率、赶时间的初级开发者可能会犯的概念性错误。最常见的一类问题是，模型会替你做出错误假设，然后毫不质疑地一路跑下去。它们不擅长管理自己的困惑，不会主动寻求澄清，不会指出不一致之处，不会展示权衡取舍，在该反驳的时候也不会反驳，而且仍然有点过度迎合用户。在 plan 模式下情况会好一些，但我觉得还需要一种轻量级的、内联的 plan 模式。它们也非常喜欢把代码和 API 过度复杂化，抽象层次膨胀，不会在完成任务后清理死代码，等等。它们可能会用 1000 行代码实现一个低效、臃肿、脆弱的结构，而你必须提醒一句：“呃，这里不能直接这么做吗？”然后它就会说：“当然可以！”并立刻把代码压缩到 100 行。它们有时还会作为副作用，修改或删除自己“不喜欢”或“没完全理解”的注释和代码，即便这些内容与当前任务并不相关。所有这些问题，即使我在 CLAUDE.md 里用了一些简单指令试图纠正，依然会发生。尽管如此，这依然是一次巨大的正向提升，几乎无法想象再回到纯手写编码的状态。简单总结一下：每个人都在形成自己的工作流，我目前的配置是——左边在 ghostty 的窗口/标签里开几个 CC 会话，右边开 IDE 用来查看代码和进行手动编辑。

韧性。
观察一个代理不知疲倦地啃一个问题，真的非常有意思。它们永远不会累，永远不会泄气，只会不停地尝试，而人类早就会在很久之前放弃、留待下次再战。看着它在一个问题上挣扎很久，最后在 30 分钟后取得胜利，是一种“感受到 AGI”的瞬间。你会意识到，耐力本身是工作中的一个核心瓶颈，而有了 LLM 之后，这个瓶颈被极大地抬高了。

加速效应。
要如何衡量 LLM 带来的“速度提升”，其实并不清楚。当然，我确实感觉自己在原本打算做的事情上快了很多，但更主要的效果是：我做了大量原本根本不会去做的事情。原因有两个：第一，我现在可以去实现各种以前完全不值得花时间去写的东西；第二，我可以去接触、处理一些以前因为知识或技能不足而完全无法下手的代码。所以这当然是加速，但更像是一种扩张。

杠杆。
LLM 非常擅长在循环中反复尝试，直到满足明确的目标，这正是大多数“感受到 AGI”的魔力所在。不要告诉它具体该怎么做，而是给它成功标准，然后看着它自己去跑。让它先写测试，再让它把测试跑通；把它接入浏览器 MCP 的循环里；先写一个极有可能正确但朴素的算法，然后再要求它在保持正确性的前提下进行优化。把你的思维方式从命令式转为声明式，让代理跑得更久，从而获得更大的杠杆。

乐趣。
我原本没想到，用代理编程反而会变得更有趣，因为大量填空式的苦差事被移除了，剩下的主要是创造性的部分。我也更少被卡住（而被卡住一点都不好玩），而且会感到更有勇气，因为几乎总能找到一种方式与它并肩作战，取得一些正向进展。我也见过完全相反的感受；LLM 编程很可能会把工程师分成两类：一类主要是喜欢“写代码”，另一类主要是喜欢“造东西”。

退化。
我已经注意到，自己手写代码的能力正在慢慢退化。生成（写代码）和判别（读代码）在大脑中是两种不同的能力。由于编程中涉及大量细碎、偏语法层面的细节，即使你写起来很吃力，审阅代码通常仍然问题不大。

Slopocalypse（垃圾洪水）。
我已经在为 2026 年做心理准备——那很可能会成为 GitHub、Substack、arXiv、X / Instagram 乃至整个数字媒体领域的“垃圾洪水之年”。与此同时，我们也会看到更多 AI 炒作式的生产力表演（这居然还能再升级？），当然，也会伴随着真实而重大的改进。

一些问题。
最近我脑子里反复盘旋的几个问题是：

“10 倍工程师”会发生什么变化？平均工程师和顶尖工程师之间的生产力差距，很可能会大幅扩大。
在 LLM 的加持下，通才是否会越来越胜过专才？LLM 在补齐细节（微观层面）上非常强，但在宏观战略上相对较弱。
未来的 LLM 编程体验会是什么感觉？像玩《星际争霸》？像玩《异星工厂》？还是像演奏音乐？
社会中有多大一部分，实际上被数字化知识工作所限制？

总结。
那么，这一切意味着什么？到 2025 年 12 月左右，LLM 代理能力（尤其是 Claude 和 Codex）似乎跨过了某种连贯性的门槛，在软件工程及其相邻领域引发了一次相变。智能本身突然显得比其他一切都要领先——无论是集成（工具、知识），还是新的组织工作流、流程，以及更广泛的扩散问题。2026 年注定会是一个高能量的一年，整个行业都将在消化和吸收这种新能力的过程中高速运转。

Subscribe 订阅