最近关于 Anthropic 的一个传闻非常引人注目:他们很可能即将迎来历史上第一个盈利季度。与此同时,越来越多企业开始发现,内部员工对 LLM 的使用,正在让 AI 成本以一种远超预期的速度膨胀。大量公司突然意识到,AI 已经不再是一个“试验性预算”项目,而是正在迅速演变成新的基础设施开支。
我越来越倾向于认为,这背后真正发生的事情其实非常简单:
OpenAI 和 Anthropic 都已经找到了 product-market fit。
而且,这次并不是 ChatGPT 那种“用户很多但不知道怎么赚钱”的 consumer PMF,而是真正能够大规模转化为收入、并可能最终覆盖巨额基础设施投入的 enterprise PMF。
企业客户现在实际上正在按 API 原价付费
我目前同时订阅了 Anthropic 的 $100/月 Max plan,以及 OpenAI 的 $100/月 Pro plan。如果你是 coding agent 的重度用户,那么这两个订阅几乎可以说是不可思议地便宜。
我最近在自己的笔记本上运行了 ccusage 工具,估算了一下过去 30 天里,如果完全按照 API token 原价计费,我到底会花多少钱。结果显示:
- Anthropic Claude Code:$1,199.79
- OpenAI Codex:$980.37
也就是说,在过去一个月里,我总共消费了价值 $2,180.16 的 token,但实际只支付了 $200。
而更关键的是,我甚至算不上那种全天候持续跑 agent 的疯狂用户。我只是一个相对重度、但仍然属于正常工作流范围内的使用者而已。
因此,我之前一直理所当然地认为:那些真正大规模部署 agent 的企业客户,肯定拿到了远低于 API 原价的大额折扣。
后来我才发现,现实恰恰相反。
我没有找到 Anthropic 精确调整 Enterprise pricing 的日期,但很明显,在过去半年中的某个时间点,他们彻底改变了定价逻辑。
最早在 2025 年 8 月,Anthropic 对 Enterprise 产品的描述还是:
“Claude seats include enough usage for a typical workday.”
也就是说,当时的逻辑更接近 SaaS seat licensing:企业按 seat 付费,而 usage 被视作套餐的一部分。
但后来,他们悄悄切换到了完全不同的模式:
- $20/seat/月
- 外加 API usage 按量收费
The Information 在 2026 年 4 月 14 日报道过这一变化,而 Anthropic 的发言人则表示,这项调整实际上早在 2025 年 11 月就已经完成,只不过许多老客户直到续约时才真正意识到。
OpenAI 几乎也在同一时间做了类似事情。
Codex 当前的 rate card 中明确写道:
2026 年 4 月 2 日起,Codex 的定价方式从“按消息计费”改为“按 API token usage 计费”。
随后在 4 月 23 日,这项变化进一步扩展到所有现有 Enterprise 客户,包括 Edu、Health、Gov 和 ChatGPT for Teachers。
OpenAI 用的是一种叫 “credits” 的体系,因此表面上看起来不那么直观;但我仔细核对后发现,那些 credit 本质上与 API token 成本完全等价。
换句话说,截至 2026 年 4 月:
Anthropic 与 OpenAI 的 enterprise coding agent 产品,实际上已经开始要求企业客户按 API 原价支付 inference 成本。
与此同时,两家公司又恰好在同一个月发布了更贵的新模型:
- GPT-5.5 的 API 价格是 GPT-5.4 的两倍;
- Opus 4.7 在考虑 tokenizer 变化后,价格大约是 Opus 4.6 的 1.4 倍。
因此,2026 年 4 月真正发生的事情,其实是:
这两家 frontier AI labs 同时意识到,企业已经愿意支付真正的 inference 成本了。
而这,恰恰就是 PMF 最明确的信号之一。
coding agent 才是真正的 product-market fit
为什么两家公司会突然如此激进地提高价格?
一个显而易见的解释是:Anthropic 与 OpenAI 都正在准备 IPO,因此需要改善财务数据。
但我怀疑,还有一个更加根本的原因:
他们终于确认,市场真的需要这些产品。
更准确地说,他们确认了:
企业愿意长期、高频、高成本地使用 coding/general-purpose agent。
而 Claude Code、Cowork 与 Codex,就是这种 PMF 的具体体现。
过去几年里,像 ChatGPT 这样的产品虽然拥有惊人的用户增长,但始终存在一个根本问题:
用户规模并不自动等于收入规模。
今年 2 月,OpenAI 宣布 ChatGPT 周活跃用户已经突破 9 亿,但其中真正付费的 consumer subscriber 只有 5000 万,占比仅为 5.6%。
这当然已经是一门很大的生意了,但问题在于,AI 基础设施本身的规模实在太夸张。
如果行业最终真的要投入接近 1 万亿美元建设 GPU、数据中心与能源系统,那么单纯依赖每月 $10-$20 的 consumer subscription,很难支撑这个故事。
你可能需要:
- 十几亿长期订阅用户
- 持续数年
- 且 churn 极低
才有机会覆盖这种级别的基础设施开支。
而 enterprise usage 完全是另一回事。
如果企业愿意为每位员工每月支付 $200、$500,甚至上千美元,那么 revenue scaling 的速度会快得多。
而且,正如我自己已经亲身体验到的那样,一个真正的 power user,每个月产生上千美元 token 消耗其实非常容易。
coding agent 真正改变了一切。
因为这类产品同时满足了两个此前从未同时成立的条件:
第一,它们极其消耗 token。
第二,它们又确实能创造实际生产力价值。
过去的大多数 AI 产品,要么 usage 很轻,要么 usefulness 很弱;而 coding agent 则第一次把“高 compute consumption”与“真实工作价值”绑定到了一起。
更重要的是,这些产品面对的用户,并不是普通 consumer,而是高薪知识工作者。
目前最明显的群体当然还是软件工程师,但从本质上来说,coding agent 能自动化的,并不只是写代码。
它实际上可以自动化:
任何通过电脑输入命令完成的工作。
因此,它天然会逐渐扩展到:
- 分析师
- 律师
- 研究员
- 金融从业者
- 运维人员
- 产品经理
- 数据科学家
以及更多知识工作岗位。
而这,也意味着 inference usage 的上限可能远比今天看起来更高。
2025 年 11 月是能力拐点,而 2026 年 4 月是商业拐点
我过去一直把 2025 年 11 月称作 “November inflection point”。
因为那是 GPT-5.1 与 Opus 4.5 发布的时间点,而它们配合对应的 coding agent harness 后,第一次真正达到了一种关键状态:
agent 不再只是 demo。
它开始能够稳定完成真实工作。
过去六个月里,整个行业其实一直在慢慢适应这一变化。大家逐渐意识到,这些系统已经不是“未来技术”,而是真正能每天创造价值的生产工具。
因此,现在企业开始愿意为它们支付高昂费用,其实并不奇怪。
真正让我觉得重要的是:
2026 年 4 月,第一次出现了明显的“商业拐点”。
因为从这个时间点开始,frontier AI labs 已经不再试图通过低价补贴来扩大 adoption,而是开始直接收取真实 inference 成本。
而企业居然接受了。
这说明:
市场已经不再把这些 agent 当成实验性工具,而是把它们视作真正必要的生产力基础设施。
企业销售与 support 招聘也说明了一切
另一个非常明显的信号,其实来自招聘市场。
OpenAI 当前大约有 703 个 open jobs,其中约 229 个——也就是 32.6%——都与 enterprise sales、support 或 deployment 相关,包括:
- Account Executive
- Go To Market
- Forward Deployed Engineer
等等。
Anthropic 的情况也非常类似。
他们当前约有 390 个 open jobs,其中超过四分之一明显偏 enterprise。
这其实是一件非常有趣、甚至略带讽刺意味的事情。
因为这些 AI labs 最终选择的商业模式,居然是高度依赖人类劳动的 enterprise sales。
Enterprise contract 不会自己成交;大型企业 adoption 仍然需要大量真人参与、支持、集成与长期维护。
也就是说,AI 最终找到 PMF 的路径,居然不是“完全自动化”,而是传统 enterprise software sales。
关于“AI 失败”的故事,其实远没有想象中严重
最近市场上有大量关于“企业开始对 AI 成本失控感到恐慌”的报道。
但我认真研究后发现,这些故事其实相当薄弱。
最著名的案例当然是 Uber。
Uber CTO 曾表示,公司在 2026 年刚过几个月时,就已经花光了全年 AI 预算,而主要原因是 Claude Code。
但老实说,这件事本身并不奇怪。
Claude Code 真正开始变得“极其有用”,其实就是从 2025 年 11 月开始。因此,一个在 2025 年制定的预算,没有预测到 2026 年 coding agent usage 的爆炸式增长,完全合理。
后来这个故事进一步被放大,是因为 Uber COO Andrew Macdonald 在播客中提到:
虽然 25% 的代码提交已经来自 Claude Code,但公司暂时还无法明确证明,它是否直接带来了 25% 更多的业务价值。
结果这句话最终被媒体扭曲成:
“Uber 已经开始怀疑 AI 投入是否值得。”
但实际上,这完全是两回事。
企业很难量化 productivity gain,并不意味着这些工具没有价值;它只意味着,组织层面的 productivity measurement 本来就极其困难。
另一个热门案例是 Microsoft 开始取消 Claude Code license。
很多人把它解读成:
“AI 太贵了,所以微软自己都不用了。”
但根据 The Verge 的报道,真正原因更像是:
微软财年临近结束,需要控制预算。
而在我看来,这些案例反而更加证明了 PMF 的存在。
因为我听过关于定价最经典的一句话就是:
最好的价格,是客户先倒吸一口凉气,然后还是点头答应。
Uber 的预算超支与 Microsoft 的 seat 调整,看起来恰恰就是这种现象。
inference 规模可能已经远超外界想象
最近另一个极其重要的信息,来自 SpaceX 的 S-1 文件。
文件披露:
Anthropic 与 SpaceX 签署了一份 cloud services agreement,未来几年内,每月将支付约 12.5 亿美元,以获得 COLOSSUS 与 COLOSSUS II 的 compute capacity。
而 Anthropic 后来的公开表述,则明确暗示这些 capacity 主要用于:
Claude Code 与 Claude API inference。
也就是说:
仅仅 inference,本身就已经能支撑每月十亿美元级别的 compute 开支。
而更重要的是:
Anthropic 原本就已经拥有大量其他 compute provider。
即便如此,他们依然愿意额外支付如此巨额费用,去购买更多 inference capacity。
这说明,现在整个行业真正的瓶颈,已经越来越像是:
“有没有足够 compute”,而不是“有没有足够用户”。
API revenue 本身的重要性也在下降
过去几年里,我一直感觉:
- OpenAI 更依赖 subscription revenue
- Anthropic 更依赖 API revenue
尤其 Anthropic,很长时间都严重依赖少数几个大客户。
例如 2025 年的一则 VentureBeat 报道曾提到:
仅 Cursor 与 GitHub Copilot,就贡献了 Anthropic 当时 40 亿美元收入中的 12 亿。
但现在情况已经开始改变。
Anthropic 据传第二季度收入将达到 109 亿美元,甚至可能首次实现 operating profit。
而这种向 enterprise 的转向,其实说明了一件非常关键的事情:
这些 labs 已经意识到:
真正的钱,不在于给别人提供底层模型,而在于自己直接做最终产品。
Claude Code 本质上已经在直接与:
- Cursor
- Copilot
竞争。
因此,Cursor 现在开始研发自己的模型,也就完全合理了。
2026 年 4 月可能会被视作新的时代节点
如果说 2025 年 11 月是“能力层面的拐点”,那么我认为:
2026 年 4 月,很可能会成为“商业层面的拐点”。
因为从这个时间点开始,AI 行业第一次真正证明:
这些 agent 不只是大家爱玩、爱讨论的技术产品,而是企业愿意长期、持续、大规模付费的生产力系统。
而这,才是真正意义上的 product-market fit。