Рейтинг нейросетей
Сравнивай модели, бенчмарки и цены. Быстро находи лучшее под твои задачи.
Мы фокусируемся на том, чтобы предоставить вам наиболее точные и актуальные данные от лучших разработчиков ИИ
Топ языковых моделей
| # | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | GLM-4.7 | 205K | 21 дек. 2025 г. | - | 358.0B | Нет | 0.60 | 2.20 | - | 86.0% | - | 73.8% | - | 87.0% | - | |
| 2 | Gemini 3 Flash | 1049K | 16 дек. 2025 г. | 1 янв. 2025 г. | - | Да | 0.50 | 3.00 | - | 90.0% | - | - | - | - | - | |
| 3 | GPT-5.2 | 256K | 10 дек. 2025 г. | 1 авг. 2025 г. | - | Да | 1.50 | 6.00 | - | 92.0% | - | - | - | 99.0% | - | |
| 4 | Claude Opus 4.5 | 200K | 23 нояб. 2025 г. | 1 мар. 2025 г. | - | Да | 5.00 | 25.00 | - | 87.0% | - | 81.0% | - | 89.0% | - | |
| 5 | Gemini 3 Pro | 1049K | 17 нояб. 2025 г. | 1 янв. 2025 г. | - | Да | 2.00 | 12.00 | - | 92.0% | - | - | - | - | - | |
| 6 | GPT-5.1 Medium | 256K | 11 нояб. 2025 г. | - | - | Да | 1.00 | 4.00 | - | - | - | - | - | - | - | |
| 7 | GPT-5.1 High | 256K | 11 нояб. 2025 г. | - | - | Да | 2.00 | 8.00 | - | 88.0% | - | - | - | - | - | |
| 8 | GPT-5.1 Thinking | 256K | 11 нояб. 2025 г. | - | - | Да | 3.00 | 12.00 | - | 88.0% | - | - | - | 96.0% | - | |
| 9 | GPT-5.1 Instant | 256K | 11 нояб. 2025 г. | - | - | Да | 0.30 | 1.20 | - | 88.0% | - | 75.0% | - | 96.0% | - | |
| 10 | MiniMax | MiniMax M2 | 1000K | 26 окт. 2025 г. | - | 230.0B | Нет | 1.00 | 4.00 | - | 78.0% | - | - | - | 77.0% | - |
Размер контекстного окна
У каждой модели свой способ разделения текста на токены. Примерно токен = 3-4 символа, но зависит от языка и модели.
Важно: OpenAI считает по-одному, Claude по-другому, поэтому точные цифры всегда отличаются.
Чтобы понять масштаб — миллион токенов это:
~150 слов в минуту
~500 слов на страницу
~60 символов на строку
~150 слов в минуту
~500 слов на страницу
~60 символов на строку
На основе среднего количества символов в строке. См. Wikipedia.
Топ модели в вызове инструментов (Tool Calling)
Примеры Tool Calling в действии
→ send_email(to="ivan@company.com", subject="Отчёт", attachment="report.pdf")
→ get_weather(city="Moscow", lang="ru")
→ book_flight(date="2025-01-07", destination="SPB")
→ send_email(to="ivan@company.com", subject="Отчёт", attachment="report.pdf")
→ get_weather(city="Moscow", lang="ru")
→ book_flight(date="2025-01-07", destination="SPB")
Почему это важно для разработчиков
Представь: ты просишь модель проанализировать код, потом запустить тесты, затем зафиксировать изменения в git. Если модель в одном из шагов накосячит — всё развалится. Чем выше процент, тем меньше шансов, что твой автоматизированный процесс сломается на ровном месте.
Скорость генерации токенов
Отладка: 15 моделей, макс скорость: 327.7 т/с
Демонстрация скорости генерации токенов
Значения сбрасываются каждые 15 секунд для демонстрации разных скоростей
Рейтинги LLM
Лучшая модель - Код
Лучшая мультимодальная модель
Лучшая модель - Знания
Самый длинный контекст
Самый дешевый API
Самый быстрый API
Лучшая модель - Код
Лучшая мультимодальная модель
Лучшая модель - Знания
Самый длинный контекст
Самый дешевый API
Самый быстрый API
Новости ИИ
Последние события из мира нейросетей

Anthropic выпустила Cowork: Claude теперь работает с файлами на вашем компьютере

Apple отдала Siri в руки Google
Gigabyte показала DDR5-7200 на 256 ГБ для локального AI

Глава Qwen: Китай отстаёт от США в AI из-за нехватки compute
Бенчмарки и тесты
MMLU
ЗнанияТест на понимание языка и широкие знания в 57 предметах
HumanEval
ПрограммированиеРешение задач по программированию на Python
GPQA
НаукаВопросы уровня PhD по физике, химии и биологии
ARC
РассужденияЛогические задачи для школьников на рассуждения
SWE-Bench
ИнженерияРеальные задачи разработки программного обеспечения
MMMU
МультимодальностьМультимодальные задачи на понимание изображений и текста
GSM8K
МатематикаМатематические задачи уровня начальной школы
HellaSwag
ПониманиеТест на здравый смысл и понимание контекста
Arena Hard
ДиалогиСложные задачи из пользовательских запросов
ComplexFuncBench
Tool CallingСложные сценарии вызова функций с многоступенчатыми задачами
Tau2
Tool CallingКомплексные сценарии вызова инструментов с множественными параметрами
ToolBench
Tool CallingПрактические задачи использования API в реальных сценариях
MMLU
ЗнанияТест на понимание языка и широкие знания в 57 предметах
HumanEval
ПрограммированиеРешение задач по программированию на Python
GPQA
НаукаВопросы уровня PhD по физике, химии и биологии
ARC
РассужденияЛогические задачи для школьников на рассуждения
SWE-Bench
ИнженерияРеальные задачи разработки программного обеспечения
MMMU
МультимодальностьМультимодальные задачи на понимание изображений и текста
GSM8K
МатематикаМатематические задачи уровня начальной школы
HellaSwag
ПониманиеТест на здравый смысл и понимание контекста
Arena Hard
ДиалогиСложные задачи из пользовательских запросов
ComplexFuncBench
Tool CallingСложные сценарии вызова функций с многоступенчатыми задачами
Tau2
Tool CallingКомплексные сценарии вызова инструментов с множественными параметрами
ToolBench
Tool CallingПрактические задачи использования API в реальных сценариях