LLM Leaderboard

Рейтинг языковых моделей на основе данных LMSYS Chatbot Arena

Рейтинг моделей (ELO)

Обновляется на основе результатов сравнений пользователей

РангМодельELO RatingПобедПораженийWin Rate
#1
GPT-4125012,5003,20079.6%
#2
Claude 3 Opus122011,8003,50077.1%
#3
GPT-4 Turbo120011,2003,80074.7%
#4
Claude 3 Sonnet118010,5004,20071.4%
#5
Gemini Pro11509,8004,50068.5%
#6
Claude 3 Haiku11209,2004,80065.7%
#7
GPT-3.5 Turbo11008,8005,00063.8%
#8
Llama 3 70B10808,5005,20062.0%