DeepSeek 推出了其最新开源推理模型 DeepSeek-R1

中国 AI 实验室 DeepSeek 推出了其最新开源推理模型 DeepSeek-R1，引发行业广泛关注。据称，这款模型在某些基准测试中的表现已媲美 OpenAI 的 o1 模型，同时具备完全开源和商用无约束的优势。

开源与商业许可：
R1 已通过 MIT 许可在 Hugging Face 平台上线，这意味着开发者可自由下载并将其用于商业项目，无需额外限制。
卓越的基准表现：
根据 DeepSeek 的技术报告，R1 在以下基准测试中优于 OpenAI 的 o1：
- AIME： 使用其他模型对其推理性能进行评价。
- MATH-500： 包括大量数学文字题，衡量模型的数学推理能力。
- SWE-bench Verified： 专注编程任务，评估模型的代码生成能力。
推理模型优势：
推理模型如 R1 的特点在于“自我校验”，这使其在物理、科学和数学等领域的表现更加可靠。尽管生成答案所需时间稍长（从秒到数分钟不等），但其准确性显著优于普通模型。
灵活的参数配置：
- 全尺寸版本： R1 拥有 6710 亿参数，是当前市场上最大规模的推理模型之一。
- 精简版本： 为适配更多硬件需求，DeepSeek 提供了从 1.5 亿到 700 亿参数的多种精简版模型，其中最小版本可在笔记本电脑上运行。
- 成本优势： 全尺寸 R1 通过 DeepSeek 的 API 提供服务，价格比 OpenAI 的 o1 模型低 90%-95%。

内容审查：
作为中国模型，R1 需接受中国互联网监管机构的审查，确保其回答符合“社会主义核心价值观”。因此，R1 对涉及天安门事件或台湾自治等敏感话题会直接拒绝响应。这种过滤机制也存在于许多中国 AI 模型中。
国际政策阻力：
在 R1 发布前不久，美国拜登政府提议加强对中国 AI 技术的出口限制。如果新规通过，中国企业将面临更严格的芯片技术和 AI 模型获取限制。这可能影响类似 R1 这样大规模 AI 系统的研发与部署。

竞争格局变化：
DeepSeek 是第一个推出媲美 o1 的中国实验室，而包括阿里巴巴和 Moonshot AI（旗下的 Kimi 模型）在内的其他公司也在加速追赶。越来越多的模型正在接近国际领先水平，挑战 OpenAI 等头部企业的主导地位。
本地化模型的普及：
随着 R1 精简版的发布，高性能推理模型将进一步下沉至消费级硬件，让用户在本地运行 AI 成为现实。正如乔治梅森大学 AI 研究员 Dean Ball 所言，这种能力的普及可能减少对中心化控制的依赖。
政策与技术的交汇：
OpenAI 副总裁 Chris Lehane 已公开呼吁美国政府加大对本土 AI 发展的支持，以避免中国 AI 模型超越美国。这种呼声或将加剧全球 AI 技术的竞争格局。

DeepSeek-R1 的发布不仅展示了中国 AI 实验室在推理模型领域的技术实力，也标志着开源 AI 模型的新高度。尽管存在内容审查和政策挑战，其性能与灵活性已让全球开发者看到更广阔的应用前景。随着类似 R1 的模型继续扩展，AI 技术的平民化趋势或将以更快速度到来。

Subscribe 订阅