OpenAI 最新发布的 GPT-4.1 系列在 API 中正式上线!这次不只是模型升级,还带来了三个不同版本:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。整体性能全面超越 GPT-4o 系列,无论是写代码、听指令还是处理超长上下文,都有质的飞跃。
这批新模型最高支持 100 万个 token 的超长上下文理解,知识库也同步更新到了 2024 年 6 月,堪称最聪明的“记忆王”。在权威测试中表现亮眼,例如在 SWE-bench Verified 编程测试中,GPT-4.1 的完成率高达 54.6%,碾压 GPT-4o 和 GPT-4.5。
不仅如此,GPT-4.1 在指令执行方面也表现出色,在 Scale 的 MultiChallenge 测试中拿下了 38.3% 的高分,提升明显。而在理解无字幕长视频的 Video-MME 测试中更是一骑绝尘,得分 72%,再次刷新记录。

别看 mini 和 nano 版本体积小,实力可不含糊。GPT-4.1 mini 不仅在许多测试中击败了 GPT-4o,延迟还减半,费用省了 83%。至于 GPT-4.1 nano,它是迄今为止最快、最便宜的模型,专为高效处理分类和自动补全等任务而生,堪称“性价比天花板”。

在真实应用场景中,比如 Windsurf 和 Qodo 都发现 GPT-4.1 的表现比旧模型更稳定,工具调用效率提高约 30%,代码质量提升显著。
此外,这代模型在处理多轮对话、复杂文档、法律分析、财务抽取等方面也展现出了前所未有的能力。像是 Thomson Reuters 和 Carlyle 就在自家 AI 助理中引入了 GPT-4.1,并获得了最高 50% 的性能提升。
视觉理解同样进化明显,GPT-4.1 在各类图像测试中表现优异,mini 版本甚至在部分测试中胜过 GPT-4o,显示出在图片、图表、视频等多模态任务中的强劲能力。
价格方面也更友好。新模型通过优化推理效率,让使用成本显著下降。以 GPT-4.1 为例,相比 GPT-4o 成本低了 26%;GPT-4.1 nano 则是目前最便宜的模型,适合大规模调用场景。

总之,GPT-4.1 系列不仅让 AI 更聪明,还更实用、更亲民。对于开发者而言,这意味着可以更轻松地构建更强大的智能系统,拓展各种智能代理应用。现在所有开发者都可以在 API 中使用 GPT-4.1 系列,赶紧试试吧!