OpenAI 最新发布的 GPT-4.1 系列在 API 中正式上线

OpenAI 最新发布的 GPT-4.1 系列在 API 中正式上线！这次不只是模型升级，还带来了三个不同版本：GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。整体性能全面超越 GPT-4o 系列，无论是写代码、听指令还是处理超长上下文，都有质的飞跃。

这批新模型最高支持 100 万个 token 的超长上下文理解，知识库也同步更新到了 2024 年 6 月，堪称最聪明的“记忆王”。在权威测试中表现亮眼，例如在 SWE-bench Verified 编程测试中，GPT-4.1 的完成率高达 54.6%，碾压 GPT-4o 和 GPT-4.5。

不仅如此，GPT-4.1 在指令执行方面也表现出色，在 Scale 的 MultiChallenge 测试中拿下了 38.3% 的高分，提升明显。而在理解无字幕长视频的 Video-MME 测试中更是一骑绝尘，得分 72%，再次刷新记录。

别看 mini 和 nano 版本体积小，实力可不含糊。GPT-4.1 mini 不仅在许多测试中击败了 GPT-4o，延迟还减半，费用省了 83%。至于 GPT-4.1 nano，它是迄今为止最快、最便宜的模型，专为高效处理分类和自动补全等任务而生，堪称“性价比天花板”。

在真实应用场景中，比如 Windsurf 和 Qodo 都发现 GPT-4.1 的表现比旧模型更稳定，工具调用效率提高约 30%，代码质量提升显著。

此外，这代模型在处理多轮对话、复杂文档、法律分析、财务抽取等方面也展现出了前所未有的能力。像是 Thomson Reuters 和 Carlyle 就在自家 AI 助理中引入了 GPT-4.1，并获得了最高 50% 的性能提升。

视觉理解同样进化明显，GPT-4.1 在各类图像测试中表现优异，mini 版本甚至在部分测试中胜过 GPT-4o，显示出在图片、图表、视频等多模态任务中的强劲能力。

价格方面也更友好。新模型通过优化推理效率，让使用成本显著下降。以 GPT-4.1 为例，相比 GPT-4o 成本低了 26%；GPT-4.1 nano 则是目前最便宜的模型，适合大规模调用场景。

总之，GPT-4.1 系列不仅让 AI 更聪明，还更实用、更亲民。对于开发者而言，这意味着可以更轻松地构建更强大的智能系统，拓展各种智能代理应用。现在所有开发者都可以在 API 中使用 GPT-4.1 系列，赶紧试试吧！

Subscribe 订阅