编程工作流。
鉴于最近一轮大语言模型编程能力的明显跃升,和许多人一样,我在极短时间内完成了一个非常陡峭的转变:11 月时,我大概还是 80% 手写代码 + 自动补全、20% 使用代理;而到了 12 月,已经变成了 80% 代理编程、20% 编辑和修修补补。也就是说,我现在基本上是在用英语写程序了——有点不好意思地用“人话”告诉 LLM 要写什么代码。说实话,这对自尊心有点伤害,但能够以“大块代码动作”的方式操控软件,整体收益实在太高了,尤其是在你逐渐适应它、配置好它、学会如何使用它,并真正理解它能做什么、不能做什么之后。这无疑是我将近二十年编程生涯中,对基础编程工作流影响最大的一次变化,而且它是在短短几周内发生的。我预计,现在已经有相当一部分工程师(很容易达到两位数百分比)正在经历类似的转变,而这种变化在普通大众中的认知度,却仍然停留在个位数的低水平。
IDE / 代理蜂群 / 易错性。
在我看来,现在无论是“已经不需要 IDE 了”的炒作,还是“代理蜂群”的炒作,都有点言过其实。模型确实仍然会犯错,如果你在写任何你真正关心的代码,我都会建议你像鹰一样盯着它——在旁边开一个清晰、完整的 IDE。错误的类型已经发生了很大变化:不再是简单的语法错误,而是那种略显草率、赶时间的初级开发者可能会犯的概念性错误。最常见的一类问题是,模型会替你做出错误假设,然后毫不质疑地一路跑下去。它们不擅长管理自己的困惑,不会主动寻求澄清,不会指出不一致之处,不会展示权衡取舍,在该反驳的时候也不会反驳,而且仍然有点过度迎合用户。在 plan 模式下情况会好一些,但我觉得还需要一种轻量级的、内联的 plan 模式。它们也非常喜欢把代码和 API 过度复杂化,抽象层次膨胀,不会在完成任务后清理死代码,等等。它们可能会用 1000 行代码实现一个低效、臃肿、脆弱的结构,而你必须提醒一句:“呃,这里不能直接这么做吗?”然后它就会说:“当然可以!”并立刻把代码压缩到 100 行。它们有时还会作为副作用,修改或删除自己“不喜欢”或“没完全理解”的注释和代码,即便这些内容与当前任务并不相关。所有这些问题,即使我在 CLAUDE.md 里用了一些简单指令试图纠正,依然会发生。尽管如此,这依然是一次巨大的正向提升,几乎无法想象再回到纯手写编码的状态。简单总结一下:每个人都在形成自己的工作流,我目前的配置是——左边在 ghostty 的窗口/标签里开几个 CC 会话,右边开 IDE 用来查看代码和进行手动编辑。
韧性。
观察一个代理不知疲倦地啃一个问题,真的非常有意思。它们永远不会累,永远不会泄气,只会不停地尝试,而人类早就会在很久之前放弃、留待下次再战。看着它在一个问题上挣扎很久,最后在 30 分钟后取得胜利,是一种“感受到 AGI”的瞬间。你会意识到,耐力本身是工作中的一个核心瓶颈,而有了 LLM 之后,这个瓶颈被极大地抬高了。
加速效应。
要如何衡量 LLM 带来的“速度提升”,其实并不清楚。当然,我确实感觉自己在原本打算做的事情上快了很多,但更主要的效果是:我做了大量原本根本不会去做的事情。原因有两个:第一,我现在可以去实现各种以前完全不值得花时间去写的东西;第二,我可以去接触、处理一些以前因为知识或技能不足而完全无法下手的代码。所以这当然是加速,但更像是一种扩张。
杠杆。
LLM 非常擅长在循环中反复尝试,直到满足明确的目标,这正是大多数“感受到 AGI”的魔力所在。不要告诉它具体该怎么做,而是给它成功标准,然后看着它自己去跑。让它先写测试,再让它把测试跑通;把它接入浏览器 MCP 的循环里;先写一个极有可能正确但朴素的算法,然后再要求它在保持正确性的前提下进行优化。把你的思维方式从命令式转为声明式,让代理跑得更久,从而获得更大的杠杆。
乐趣。
我原本没想到,用代理编程反而会变得更有趣,因为大量填空式的苦差事被移除了,剩下的主要是创造性的部分。我也更少被卡住(而被卡住一点都不好玩),而且会感到更有勇气,因为几乎总能找到一种方式与它并肩作战,取得一些正向进展。我也见过完全相反的感受;LLM 编程很可能会把工程师分成两类:一类主要是喜欢“写代码”,另一类主要是喜欢“造东西”。
退化。
我已经注意到,自己手写代码的能力正在慢慢退化。生成(写代码)和判别(读代码)在大脑中是两种不同的能力。由于编程中涉及大量细碎、偏语法层面的细节,即使你写起来很吃力,审阅代码通常仍然问题不大。
Slopocalypse(垃圾洪水)。
我已经在为 2026 年做心理准备——那很可能会成为 GitHub、Substack、arXiv、X / Instagram 乃至整个数字媒体领域的“垃圾洪水之年”。与此同时,我们也会看到更多 AI 炒作式的生产力表演(这居然还能再升级?),当然,也会伴随着真实而重大的改进。
一些问题。
最近我脑子里反复盘旋的几个问题是:
- “10 倍工程师”会发生什么变化?平均工程师和顶尖工程师之间的生产力差距,很可能会大幅扩大。
- 在 LLM 的加持下,通才是否会越来越胜过专才?LLM 在补齐细节(微观层面)上非常强,但在宏观战略上相对较弱。
- 未来的 LLM 编程体验会是什么感觉?像玩《星际争霸》?像玩《异星工厂》?还是像演奏音乐?
- 社会中有多大一部分,实际上被数字化知识工作所限制?
总结。
那么,这一切意味着什么?到 2025 年 12 月左右,LLM 代理能力(尤其是 Claude 和 Codex)似乎跨过了某种连贯性的门槛,在软件工程及其相邻领域引发了一次相变。智能本身突然显得比其他一切都要领先——无论是集成(工具、知识),还是新的组织工作流、流程,以及更广泛的扩散问题。2026 年注定会是一个高能量的一年,整个行业都将在消化和吸收这种新能力的过程中高速运转。