Bard,这个由Gemini Pro-scale模型驱动的新宠,刚刚在独立的lmsys排行榜上首次亮相就摘得了第二名的好成绩!🔥
这次它取得了一个重要的里程碑,通过人类评估与OpenAI的GPT-4匹敌。谷歌AI部门的负责人Jeff Dean宣布了这个新模型,别出心裁地称之为“scale”,这意味着可能扩展了之前Pro模型的能力。双子座Pro“scale”在Chatbot Arena排行榜上成功获得第二名,超越了之前版本的GPT-4,但略落后于最新的GPT-4 Turbo版本。谷歌的Oriol Vinyals强调了评估语言模型的微妙挑战,并倡导使用人类评估而非学术基准。
大家都在期待着更强大的双子座超级模型的即将发布,期望它可能超越Pro-Scale版本的成就。
