Chatbot竞技场传来激动人心的消息!
@GoogleDeepMind的新款Gemini 1.5 Pro(实验版0801)在过去一周内进行了测试,获得了超过12,000次社区投票。首次,Google Gemini成功登顶,超越了GPT-4o和Claude-3.5,以惊人的1300分位居榜首,并在视觉排行榜上也名列第一。
Gemini 1.5 Pro(0801)在多语言任务方面表现出色,并在数学、复杂提示和编程等技术领域表现强劲。

恭喜@GoogleDeepMind取得这一显著成就!
Gemini(0801)类别排名:
- 总体:#1
- 数学:#1-3
- 指令跟随:#1-2
- 编程:#3-5
- 复杂提示(英语):#2-5
快来体验这个模型.
Gemini 1.5 Pro(实验版0801)在视觉排行榜上排名第一。


Gemini显示出强大的多语言能力:中文、日文、德文、俄文表现排名第一。


但在编程和复杂提示领域,Claude 3.5 Sonnet、GPT-4o和Llama 405B仍然领先。


总体胜率热图:Gemini 1.5 Pro(0801)对阵GPT-4o的胜率为54%,对阵Claude-3.5-Sonnet的胜率为59%。
