LLM Leaderboard

Рейтинг языковых моделей на основе данных LMSYS Chatbot Arena

Обновляется на основе результатов сравнений пользователей

Ранг	Модель	ELO Rating	Побед	Поражений	Win Rate
#1	GPT-4	1250	12,500	3,200	79.6%
#2	Claude 3 Opus	1220	11,800	3,500	77.1%
#3	GPT-4 Turbo	1200	11,200	3,800	74.7%
#4	Claude 3 Sonnet	1180	10,500	4,200	71.4%
#5	Gemini Pro	1150	9,800	4,500	68.5%
#6	Claude 3 Haiku	1120	9,200	4,800	65.7%
#7	GPT-3.5 Turbo	1100	8,800	5,000	63.8%
#8	Llama 3 70B	1080	8,500	5,200	62.0%