几周前,曾有人主张加强美国对华芯片出口管制,以限制中国在人工智能领域的快速发展。然而,DeepSeek——一家中国AI公司——近期推出的R1推理模型,在某些方面接近美国最前沿的AI模型,且训练成本大幅降低。这让外界开始质疑,既然中国AI企业能够在有限计算资源下取得突破,那么芯片出口管制是否仍然有效?
答案是:管制不仅仍然有效,而且比以往任何时候都更加重要。
出口管制的核心目标
出口管制的目的,并不是为了逃避中美之间的AI竞争,而是确保民主国家在人工智能发展上保持领先。最终,美国及其盟友必须拥有比中国更强大的AI模型,才能在全球竞争中取胜。但这并不意味着应该主动向中国共产党提供技术优势。
在讨论政策之前,先来理解影响AI发展的三个关键动态。
三大AI发展动态
1. AI的“规模法则”(Scaling Laws)
人工智能的发展遵循规模法则(Scaling Laws):训练规模越大,模型的智能水平就越高。
例如:
- 训练成本 100万美元 的模型,可能解决 20% 的代码问题;
- 成本 1000万美元 的模型,可能解决 40%;
- 1亿美元 级别的模型,可能达到 60%……
这种指数级的提升意味着,更高算力、更大数据、更长时间的训练,都能带来智能水平的突破。因此,各大AI公司投入巨资训练模型,希望通过不断扩展规模来领先竞争对手。
2. 计算效率的提升(Shifting the Curve)
AI行业一直在寻找提高计算效率的方法,无论是优化模型架构,还是改进硬件。任何技术突破,都会降低相同算力下训练模型的成本。
举例来说:
- 如果一种新算法提高了 2倍计算效率,那么一个 原本需要1000万美元训练的模型,现在只需要500万美元。
- 随着这些优化不断积累,训练成本可能会每年降低 4 倍,从而让AI变得更便宜、更强大。
然而,成本降低并不意味着公司会减少投资。反而,公司通常会把节省下来的预算投入更强的模型,以保持竞争力。因此,AI训练成本仍然在增长,而不是减少。
3. 推理模型的新范式(Shifting the Paradigm)
2020-2023年,AI的主要发展模式是大规模预训练(Pretraining),即用海量互联网数据训练基础模型。
2024年,强化学习(Reinforcement Learning, RL)成为新的突破点,用于训练模型的推理能力。OpenAI、Anthropic、DeepSeek等公司都开始用RL训练AI进行“思考”,让其在数学、编程、逻辑推理等领域表现更强。
目前,RL训练仍处于早期阶段,即使增加10倍的训练预算,也能带来显著的性能提升。因此,所有AI公司都在加速投资这一方向。
DeepSeek的真正突破是什么?
DeepSeek最近的发布可以分为两个阶段:
- DeepSeek-V3(预训练模型):类似于GPT-4、Claude 3.5等模型,基于传统的预训练方法。
- DeepSeek-R1(推理模型):通过强化学习训练,类似于OpenAI的o1模型,专注于提升数学、代码、推理能力。
其中,DeepSeek-V3才是最值得关注的技术突破。该模型在某些测试中接近美国顶级AI,但训练成本显著降低。这背后的关键原因是:
- 更高效的计算方法(如改进的“键值缓存”管理)
- 更先进的专家模型(Mixture of Experts, MoE)架构
尽管DeepSeek的进展令人瞩目,但仍需理性看待:
- DeepSeek的训练成本远不止600万美元,外界夸大了其效率。
- Claude 3.5 Sonnet的训练成本仅为数千万美元,并未达到“数十亿美元”级别。
- DeepSeek的模型性能仍然落后于最新的Claude 3.5和GPT-4o,只是比美国7-10个月前的模型更接近。
DeepSeek的进步是否意味着出口管制无效?
并不意味着出口管制失败,相反,它更加必要。
📌 DeepSeek并没有突破AI成本曲线,它的成就仍然符合AI行业每年成本下降4倍的趋势。
📌 DeepSeek能够成功,是因为它仍然拥有足够的算力。 其Hopper芯片集群大约有 5万块,虽然比美国顶级AI公司少 2-3倍,但仍然足以训练高质量模型。
📌 中国并未完全规避出口管制。
- DeepSeek拥有 H100(被禁运)、H800(2023年10月禁运前获得)、H20(仍在出售),说明部分芯片通过正规渠道获得,部分可能被走私。
- 但如果中国能无限制获取数百万块芯片,情况会完全不同。
出口管制的核心作用:决定AI超级强国的归属
在 2026-2027年,全球将迎来AI超智能时代,届时最顶级的AI模型需要:
- 数百万块AI芯片
- 至少100亿美元的训练预算
如果中国能够获得这些资源,全球AI格局将进入“中美双极化”:
- 美国和中国将同时拥有超级AI,推动科技和军事突飞猛进。
- 但中国政府可能优先将AI用于军事目的,强化其在全球的战略优势。
如果中国无法获得这些芯片,那么全球AI格局可能仍由美国主导:
- 美国科技公司将建立长期领先优势,形成自我强化的技术壁垒。
- AI可能成为美国及其盟友在全球经济和科技竞争中的决定性力量。
出口管制的必要性
出口管制是决定AI超级强国归属的核心手段。
📌 DeepSeek的突破不意味着中国可以随意绕过管制。
- 他们的计算资源远不及美国顶级AI公司,出口管制仍然在发挥作用。
📌 美国必须加强出口管制,防止中国获得数百万块AI芯片。
- 当前的管制策略已阻止中国获取最新的H100芯片,但仍需进一步收紧,包括H20等芯片。
📌 AI技术越强大,出口管制越重要。
- 未来的超级AI不仅影响科技和经济,还将直接决定全球军事平衡。
结论:出口管制比以往任何时候都更关键
DeepSeek的成功并不意味着出口管制无效,而是恰恰证明了出口管制的必要性。如果中国未来能获得数百万块最先进的芯片,那么全球AI格局将发生根本性改变。因此,美国及其盟友必须加紧行动,确保在AI竞赛中保持领先。