谷歌公司近日推出了其迄今为止最强大的AI模型升级版——Gemini 2.5 Pro预览版,该版本将在未来几周正式上线,届时将作为企业级应用的稳定版本全面推向市场。
此次更新的Gemini 2.5 Pro基于5月发布的版本进行优化,并在谷歌I/O大会上首次展示。根据LMArena的评测,2.5 Pro的Elo分数上升了24分,达到1470分,继续在排行榜上保持领先地位;在WebDevArena中也取得了1443分的成绩,提升35分,同样登顶。此外,该模型在编程方面表现尤为出色,领先于包括Aider Polyglot等高难度编程基准测试。
在推理能力方面,2.5 Pro在GPQA和“人类最终考试”(HLE)等严苛评测中展现出顶尖水平,这些评测主要衡量模型在数学、科学、知识和逻辑推理方面的能力。
除了性能升级,此次版本还对2.5 Pro在语言风格和结构表达上的表现进行了显著改进,更具创意,响应内容格式更清晰,回应了开发者在上一版本中的反馈。
目前,开发者已可通过 Google AI Studio 和 Vertex AI 平台,在Gemini API中使用该升级预览版本。值得一提的是,谷歌此次还引入了**“思维预算(thinking budgets)”功能**,使开发者能够更灵活地控制使用成本与响应延迟。
此外,升级版的2.5 Pro现已开始在Gemini应用中陆续推出,供用户抢先体验。