一条常见的解释认为,《星球大战》之所以能在上映近半个世纪后仍然大获成功、产生持久共鸣,是因为它几乎完美呈现了“英雄之旅”。故事里有被困在塔图因星球、生活无聊的卢克,他收到 R2-D2 带来的神秘求救信息,这是冒险的召唤,而他一开始拒绝回应;导师欧比旺引导他跨出离开塔图因的门槛,踏入充满试炼的旅程,结识新的敌人与盟友。他进入“洞穴”——死星,在经历欧比旺之死这一重大考验后逃出,带着死星的设计图前往反抗军,并为重返死星的“归途”做准备。在最终试炼中,他选择相信“原力”,并以此完全蜕变。而如果把视角放大到整部原初三部曲,会发现那只是这段英雄旅程的扩展版:这一次,“至暗时刻”的考验是整部《帝国反击战》。
在过去三年的 AI 故事中,扮演英雄角色的是两家公司:OpenAI 和英伟达。第一家是凭借 ChatGPT 的发布,被视为下一个伟大消费科技公司的初创企业;第二家则是原本以“游戏显卡公司”著称、由一位充满远见与乐观精神的创始人带领、常年经历景气循环,如今则在 AI 革命中摇身一变,成为最关键的基础设施提供者。
然而在过去两周,这两家“英雄”同时进入了属于自己的“洞穴”,面对各自迄今为止最严峻的考验:谷歌这座“帝国”,正在上演自己版本的《帝国反击战》。
谷歌的反击
谷歌的第一记重拳是 Gemini 3:这款模型在一系列基准测试中超越了 OpenAI 当时的最先进模型(尽管在真实使用体验上表现稍显参差)。Gemini 3 最大的优势在于其规模与训练过程中投入的海量算力;这点尤其值得注意,因为 OpenAI 在继续打造超越 GPT-4 体量与复杂度的下一代模型时遇到了困难。支撑 OpenAI 继续前进的,是在推理能力上的真实突破,这在许多场景下带来更好的结果,但代价是时间与成本的上升。
Gemini 3 的成功,看上去一度是英伟达的利好。有分析将英伟达列为该发布会的赢家,理由是:
一方面,英伟达似乎是输家,因为世界上最好的模型并非在其芯片上训练完成,这从根本上证明了——确实可以在不支付英伟达溢价的情况下造出顶级模型。
另一方面,英伟达又有两个乐观理由。首先,所有人现在都必须对 Gemini 做出回应,而且是“立刻”,而不是等自家芯片“足够好”的某个未来时间点。谷歌在十年前就开始投入 TPU 的研发;其他公司如果想追赶,短期内仍然更适合继续依赖英伟达。其次,也正因为如此,Gemini 再次证明,想要追赶甚至超越,最重要的因素仍然是更多算力。
不过,上述分析漏掉了一个关键问题:如果谷歌开始对外出售 TPU,把它变成英伟达的替代品,会发生什么?谷歌现在正这样做——先是与 Anthropic 达成合作,又传出与 Meta 的合作传闻,然后是第二波“新云服务商”(neocloud):其中很多原本是加密矿工,如今利用手里的电力与基础设施转型切入 AI。
很快,英伟达也被推到了瞄准镜前:市场开始重新审视其长期增长空间,尤其是考虑到其高企的利润率是否还能维持,一旦出现真正能与之抗衡的芯片对手,这个疑问就格外尖锐。这也无形中给 OpenAI 下一轮预训练施加了巨大压力——那一轮训练将基于英伟达的 Blackwell 芯片进行:基础模型仍然非常重要,OpenAI 需要给出更好的基础模型,而英伟达则需要证明,顶级模型仍然可以在自家芯片上诞生。
接下来值得思考的是:在谷歌的反击下,哪家公司的风险更大,以及原因何在?
从表面看,英伟达正赚得盆满钵满,如果 Blackwell 表现优秀,那么下一代 Vera Rubin 有望更上一层楼;此外,尽管 Meta 可能会成为谷歌的天然伙伴,但其他超大规模云厂商(hyperscalers)并非如此。
与之相对,OpenAI 则在亏损上不断刷新纪录,业务线越来越分散,同时为了尚未到来的未来收入签下越来越多算力采购承诺。
尽管如此,在保持对英伟达相当乐观的同时,分析者仍然更看好 OpenAI 的胜算。甚至可以说,一个最大的担忧是:分析者似乎比 OpenAI 自己还更看好 OpenAI 的前景。
英伟达的护城河
回到一两年前,英伟达相对于 TPU 大致有三道护城河:
- 更强的性能;
- 显著更高的灵活性(GPU 属于通用算力器件,TPU 则更专用);
- CUDA 及由此建立的开发者生态。
与此同时,OpenAI 的护城河主要在于:
- 领先的模型能力;
- 广泛使用的 API;
- 使用 ChatGPT 的海量消费者用户。
问题就在于:如果两家公司各自的第一个关键差异都减弱甚至消失,会发生什么?这正是过去两周被不断讨论的核心:
- 如果 TPU 的表现与 GPU 一样好,英伟达是否还能守住优势?
- 如果 OpenAI 不再拥有毋庸置疑的“最强模型”,它在长期是否仍然可持续?
英伟达的灵活性优势是真实存在的。正因为 GPU 在不同工作负载之间的可替代性(fungibility),微软与 Meta 才会在资本开支计划中反复强调这一点,以此作为扩张投资的论据。TPU 在硬件层面更专用,软件编程也更困难。就此而言,在客户重视灵活性的前提下,英伟达依旧是显然的首选。
至于 CUDA,它长期以来是英伟达构筑客户锁定的重要来源。一方面,它给予开发者深入硬件的底层接口;另一方面,则带来开发者层面的网络效应:如果技术栈基于英伟达,更容易招聘到熟悉相关工具链的工程师。
不过,对英伟达而言,问题在于:大型公司效应可能在 CUDA 上产生与“灵活性论证”相反的结果。大型云厂商确实拥有多元化的工作负载,因此能从 GPU 的通用性中获益,但它们同样也有能力构建替代性的软件栈。过去之所以“懒得做”,只是因为这件事不够划算;当资本开支计划扩张到数千亿美元规模时,“值得花时间和精力”这件事就被重新定义了。
一个有用的类比是 AMD 在数据中心的崛起。AMD 的崛起并非从传统机房或政府项目起步,那些领域仍由 Intel 主导;相反,是大型云厂商主动投入工程资源,重写底层软件,使之在 AMD 与 Intel 之间真正实现“无感切换”,从而让 AMD 凭借性能优势赢下这场战役。
在当前这轮竞争中,英伟达的挑战在于:其主要市场集中在少数几个超大客户手中,而这些客户有足够资源——其中大部分尚未充分动用——来打破 CUDA 这堵软件“高墙”,就像他们已对 Intel 做过的那样。
英伟达早就对此保持警觉。在 2024 年 Blackwell 发布、公司处于 AI 浪潮最高点时,有分析写道:
在 ChatGPT 发布之前,英伟达一直致力于围绕 GPU 构筑(免费的)软件护城河;当时的问题是:这些软件到底会被谁用?
如今,GPU 的用例已经非常明确,而且这些用例发生在比 CUDA 框架高得多的抽象层级(也就是各种模型之上)。同时,为了降低对英伟达依赖、寻找更便宜的替代方案,外界的压力与动力双双提升。这意味着,摆脱 CUDA 的可行性与紧迫性都达到了前所未有的高度(尽管在训练等底层任务上,完全摆脱 CUDA 仍然尚远)。
英伟达已经开始做出回应:DGX Cloud 可以被视作其试图复制“Intel 时代”的策略——在 AMD 芯片性能已更优的情况下,依旧牢牢抓住那些已经在 Intel 上标准化的客户。而 NIM 则是通过软件形态进一步构建锁定的尝试。
与此同时,值得注意的是,英伟达似乎没有在 Blackwell 上拿到外界预期中那么高的利润率;至于未来几代产品是否还要继续“让利”,则取决于两件事:其一是芯片本身的性能,其二是能否重新挖深那道正被时代浪潮侵蚀的软件护城河。
需要强调的是,在所有人都渴求算力的现实中,Blackwell 的利润表现依然相当亮眼,也理应如此。某种意义上,这让前述争论显得有些“纸上谈兵”:许多假设都默认 TPU 与 GPU 之间是零和竞争,然而真正的“决策者”很可能是负责代工的 TSMC——这家公司既生产 GPU 也生产 TPU,有望成为压制 AI 泡沫的真正“刹车踏板”。
ChatGPT 与护城河的韧性
与英伟达不同,ChatGPT 面向两个更大的市场。
第一是通过 API 使用模型的开发者市场。根据 OpenAI 本人给出的说法,这部分客户群体更具粘性,也更不愿意迁移。这是可以理解的:开发者使用某款模型的 API,是为了做出更好的产品;尽管每家公司都在谈“避免被锁定”,但对大多数团队来说,基于现有经验持续扩展往往比迁移更有收益,而对很多公司而言,这个“既有经验”就是 OpenAI。
这意味着,谷歌要想在这一市场取得优势,需要一款一款地从应用级别赢得客户,比起向公司高层展示一张“成本与总拥有成本”的对比表格,这要困难得多。当然,API 的价格仍然重要,而在成本结构上,谷歌几乎可以确定拥有结构性优势。
第二个也是最大的市场,是消费者——这是谷歌赖以生存的基本盘。谷歌在搜索领域之所以如此强大,几乎不受竞争与监管影响,是因为数十亿用户每天都在主动选择使用谷歌——而且每天会使用很多次。没错,谷歌会通过向合作伙伴支付费用的方式巩固地位,但这些行为是其掌控需求的结果,而非根源。
很多人觉得矛盾的一点在于:谷歌的地位看似脆弱——竞争真的只是“点一下”的距离——但这种“脆弱感”反而成为其真正的优势。正如一篇关于《美国诉谷歌案》的分析所指出:
数字化程度提高,会带来更强的集中性(与很多人早期对互联网“去中心化”的期待相反)。
同时,这为消费者提供了巨大便利——聚合平台(Aggregators)正是通过不断为用户构建更好的产品而获胜——这也解释了为何聚合平台的整体形象与传统垄断企业截然不同。的确,可以说谷歌在购物(Shopping)乃至本地搜索等垂直领域“扼杀”了许多依赖其流量的网站。但同样现实的是:没有任何东西阻止用户直接访问那些网站,或单独下载它们的应用,从而完全绕开谷歌。
用户之所以没有这样做,并非因为谷歌施加了某种限制——那在技术上几乎是不可能的——而是因为用户自己不愿意。监管方是否真的应该去纠正这种由用户自主做出的选择?
从哲学角度看,答案是否定的;从务实角度看,答案同样是否定的。欧洲在处理 Google Shopping 案件时不断修改补救措施要求,并非因为谷歌“顶嘴”,而是因为试图通过改变用户偏好来瓦解一个聚合平台,就像试图“推一根绳子”。
一个云厂商 CEO 可以一句话下令“摆脱 CUDA”;一名应用开发者也可以决定为了更低成本而迁移模型,即便这会带来不少阵痛。
但要改变每周使用 ChatGPT 的 8 亿多用户的习惯,就只能一位用户、一位用户地慢慢“争夺”。这一点,正是 ChatGPT 与英伟达在面对谷歌时的根本区别。
“护城河地图”与广告模式
这引出一个更广泛的观点:对护城河的“天真理解”,往往只关注“切换成本”;而真正重要的衡量指标,是“独立用户数量”。
护城河的韧性,与“独立用户数”高度正相关。
这当然是一个非常简化的示意图,但并非第一次从护城河的角度画图。早在 2018 年的一篇《护城河地图》(The Moat Map)中,有观点提出可以从两条维度来刻画大型科技公司:
第一条维度是“供应方的差异化程度”:
(图示:不同科技公司在“供应侧差异化”维度上的分布)
第二条维度是“网络效应外部化的程度”:
(图示:不同科技公司在“网络效应外部化程度”上的分布)
结合这两个维度,可以得到“护城河地图”:
(图示:“护城河地图”:右上角为平台,左下角为聚合者)
在右上角的是平台型公司:它们通过赋能高度差异化的供应方,进而从这些供应方所创造的交易中抽取利润;
而在左下角的是聚合者(Aggregators):它们把供应方完全商品化,但这样做的目的,是为了最大化对用户注意力的掌控,然后通过广告实现变现。
正是左下角这一象限,与前面那条“独立用户数与护城河韧性相关”的简化图相对应:通过聚集海量用户,将供应方商品化、将网络效应内部化,是一种典型的聚合者策略;而广告则是这类公司最自然的盈利模式——它既驱动用户规模增长,也强化护城河。
从这个视角看,ChatGPT 显然坐落在左下角象限。曾经一度看起来,内容已经无法比谷歌或 Facebook 做得更“可商品化”了;但大型语言模型恰恰又更进一步:它们给出的回答,是对所有可获取知识的统计综合,对每个用户而言都是独一无二的。同时,理论上,每一位用户的使用行为都在反过来帮助模型变得更好。
顺理成章地,ChatGPT 理应拥有一个广告业务。这不仅是为了赚钱,更是为了让产品本身变得更好:
- 更多用户、更高频的使用,会提供更多反馈;
- 对购买行为的捕捉(不是靠导购链接,而是通过个性化广告)能形成更丰富的用户画像,从而提升回答质量;
- 同时,也能大幅加深 OpenAI 的护城河。
谷歌的优势
当然,并不能排除另一种可能:谷歌最终在消费者注意力之战中取得胜利。
谷歌在图像与视频生成上的领先地位非常明显,这也是为什么有分析会专门写《YouTube 是谷歌长矛的“矛尖”》:
简而言之,当所有人都在讨论 AI 如何“颠覆搜索”的时候,对 YouTube 而言,AI 更像是一种“持续性创新”:它能提升优质内容的绝对数量,而且从长期看,这些内容的边际成本会更低。
关键问题在于:从长期看,究竟是文本更重要,还是视频更重要?
理想情况下,谷歌当然想两者皆控。但如果必须选择,主导视频还是主导文字,哪一个更关键?从过去社交网络的发展史来看,视频在长期内往往对更多人更具吸引力。
换言之,科技和媒体圈的人喜欢讨论的是文本和观点;而真正“做大做强”的往往是围绕视频和娱乐的服务。若 AI 对后者的作用更大,YouTube 就有机会成为最大的赢家——即便那些曾经不理解“为什么 Twitter 比不上 Facebook”的人,此刻仍在为文本生成与代码生成的能力兴奋不已。
谷歌也显然具备用户变现能力,即便目前还没有在 Gemini 上直接挂广告(尽管已经在“AI 总览”里这么做了)。值得注意的一点是——如 Eric Seufert 在一次访谈中提到——谷歌在搜索上线不到两年就开始变现;正是搜索广告收入,而不是风投资金,为谷歌此后多年的创新提供了坚实支撑,并终将其塑造成今天的巨头。
从这个角度看,OpenAI 在 ChatGPT 上——一个上线已三年、却始终没有广告模式的产品——迟迟不愿引入并迭代广告,无疑是一种商业上的“失职”,尤其是在公司已经签下超过万亿规模算力支出承诺的背景下更显得令人不安。
反过来也意味着:谷歌拥有足够资源,完全可以通过一场类似第一次世界大战的“消耗战”来争夺用户注意力。照理说,OpenAI 在消费者侧的领先本应牢不可破,但公司自行选择只通过订阅收费——而对大部分用户而言,产品体验反而因分级限制而“被削弱”,在收入最大化上还面临价格弹性问题——这一切都为一个真正重视“赚钱”的对手打开了突破口。
换个角度看:
- 对英伟达来说,TPU 的长期威胁是利润率被稀释;物理产品的挑战在于必须向客户直接收费,这必然带来与廉价替代品的对比,尤其当买家体量越来越大、对价格越来越敏感时,这种压力会愈发明显。
- 对 OpenAI 而言,则存在另一种可能:广告模式反过来提升利润率。因为用户不直接付费,理论上就没有收益的上限;用户规模越大,平均利润率越可能提升,进而可以支撑更大规模的前期投入。
问题只在于:ChatGPT 尚未真正拥有这一广告模式。
一个理论的“旅程”
文章一开始之所以提到“英雄之旅”,部分原因是为了顺势引出“帝国反击战”的比喻;但同时也带着一点“作者个人理论”的寓意。
多年来,此类分析的“主角”一直是“聚合理论”(Aggregation Theory)——即控制需求比控制供给更具决定性优势;在这一理论框架中,谷歌曾是典型的正面主角。与此同时,分析者也相信像英伟达这样由创始人主导的公司所带来的创新与速度;对于谷歌,其官僚结构与被颠覆的风险也长期是隐忧,相比之下,OpenAI 这种体量更小、节奏更快的公司似乎更具进攻性。
然而,最重要的一点是:掌控 8 亿用户这一规模级别的市场力量与防御性,是分析者之所以仍然认为 ChatGPT 拥有重要护城河的根本原因。
与此同时,市场对谷歌的“恐慌”也是可以理解的:在变现、数据、基础设施与研发各个层面,谷歌拥有压倒性的结构性优势,这也解释了当初 OpenAI 创立时,对“谷歌一统 AI 世界”的担忧。很容易想象这样一种结局:谷歌在各项“投入要素”上的优势最终比一切理论都更重要——这等于在现实中对“聚合理论”的核心命题进行终极检验。
从这个意义上说,谷歌从“主角”摇身一变,成了新的“反派”。
谷歌已经这样做过一次了:在搜索领域,它凭借更好的产品赢下了一个开放市场。聚合者往往通过在新市场里“做到更好”来获胜;今天的问题则是:一个已经达到规模巅峰的聚合者,是否仍然会被“资源的全面倾斜”打败?
尤其当这个聚合者因为拒绝采用最优的聚合者商业模式(即广告),而主动削弱自身优势时,这个问题更加尖锐。
接下来,将是一次现实世界里对“聚合理论”的完整测试——这一过程既让人紧张,也让人兴奋。