LLM Leaderboard
Рейтинг языковых моделей на основе данных LMSYS Chatbot Arena
Рейтинг моделей (ELO)
Обновляется на основе результатов сравнений пользователей
| Ранг | Модель | ELO Rating | Побед | Поражений | Win Rate |
|---|---|---|---|---|---|
#1 | GPT-4 | 1250 | 12,500 | 3,200 | 79.6% |
#2 | Claude 3 Opus | 1220 | 11,800 | 3,500 | 77.1% |
#3 | GPT-4 Turbo | 1200 | 11,200 | 3,800 | 74.7% |
#4 | Claude 3 Sonnet | 1180 | 10,500 | 4,200 | 71.4% |
#5 | Gemini Pro | 1150 | 9,800 | 4,500 | 68.5% |
#6 | Claude 3 Haiku | 1120 | 9,200 | 4,800 | 65.7% |
#7 | GPT-3.5 Turbo | 1100 | 8,800 | 5,000 | 63.8% |
#8 | Llama 3 70B | 1080 | 8,500 | 5,200 | 62.0% |