Рейтинг нейросетей

Сравнивай модели, бенчмарки и цены. Быстро находи лучшее под твои задачи.

Смотреть модели Бенчмарки

Обновлено: 10 июляРейтинг моделей и их параметров

Мы фокусируемся на том, чтобы предоставить вам наиболее точные и актуальные данные от лучших разработчиков ИИ

OpenAI

Anthropic

Google

Каталог нейросетей

Топ моделей по дате выхода — новейшие разработки AI-компаний

Показано 1-10 из 246

#
1	OpenAI	GPT-5.5	1000K	23 апр. 2026 г.	1 дек. 2025 г.	-	Да	5.00	35.00	-	94.0%	-	-	-	98.0%	-
2	DeepSeek	DeepSeek-V4-Pro-Max	1000K	23 апр. 2026 г.	-	1600.0B	Нет	1.00	8.00	-	-	-	-	-	-	-
3	DeepSeek	DeepSeek-V4-Flash-Max	1000K	23 апр. 2026 г.	-	284.0B	Нет	0.10	0.40	-	88.1%	-	79.0%	-	-	-
4	Moonshot AI	Kimi K2.6	262K	19 апр. 2026 г.	-	1000.0B	Да	0.95	4.00	-	90.5%	-	-	-	-	-
5	Anthropic	Claude Opus 4.7	200K	16 апр. 2026 г.	1 мая 2025 г.	-	Да	5.00	25.00	-	94.0%	-	88.0%	-	-	-
6	Zhipu AI	GLM-5.1	-	7 апр. 2026 г.	-	754.0B	Нет	-	-	-	86.2%	-	-	-	-	-
7	Google	Gemma 4 31B	262K	2 апр. 2026 г.	1 янв. 2025 г.	30.7B	Да	0.13	0.40	-	84.3%	-	-	-	-	-
8	Google	Gemma 4 26B-A4B	262K	1 апр. 2026 г.	1 дек. 2024 г.	25.2B	Да	0.13	0.40	-	82.3%	-	-	-	-	-
9	Alibaba	Qwen3.6 Plus	1000K	31 мар. 2026 г.	-	-	Да	0.30	2.20	-	90.4%	-	78.8%	-	-	-
10	Xiaomi	MiMo-V2-Omni	-	18 мар. 2026 г.	-	-	Да	-	-	-	-	-	75.0%	-	-	-

Страница 1 из 25

Смотреть все текстовые модели →

Лучшие ИИ на июль 2026

Рейтинг составлен на основе 6 ключевых бенчмарков: GPQA, SWE-Bench, Tau2, MMLU, MMMU-Pro и ARC-AGI

Gemini 3.1 Pro

Google

GPQA 94%SWE-Bench 81%

Tau2 99%GPQA 91%SWE-Bench 78%

GPQA 90%SWE-Bench 80%

85.3%

общий рейтинг

Лучший выбор по задаче

Llama 3.2 3B Instruct

← Листай для просмотра категорий →

Llama 3.2 3B Instruct

Как мы считаем общий рейтинг

GPQA(20%)+SWE-Bench(20%)+Tau2(20%)+MMLU(15%)+MMMU-Pro(15%)+ARC-AGI(10%)

Веса нормализуются по доступным данным. Модели с менее чем 2 бенчмарками не включаются в рейтинг.

Лучшие нейросети 2026 года отличаются высокой точностью в специализированных задачах: от написания кода до анализа документов. Мы ежемесячно обновляем рейтинг, чтобы вы могли выбрать оптимальную модель под свои задачи — будь то разработка, исследования или автоматизация рутинных процессов.

Новости ИИ

Последние события, новинки и горячие новости про нейросети

Все новости

anthropicagi

Война за таланты: как Anthropic обгоняет OpenAI и Meta в найме

Anthropic агрессивно наращивает исследовательские команды под AGI: штат удвоился, пришёл Карпаты, нанимают философов. Разбираем стратегию перед IPO.

3 июл.8 мин

anthropicclaude

Claude Fable 5 вернулся: Anthropic снова открыла доступ по всему миру

США сняли экспортный контроль — и Anthropic вернула Fable 5 глобально. Разбираем сроки, цены, бенчмарки и новые механизмы защиты самой мощной модели.

3 июл.8 мин

anthropicclaude

Лимит за девять минут: бунт подписчиков Claude Max

Fable 5 сжигает квоту в разы быстрее, а иск обвиняет Anthropic в завышении лимитов Max 5x и 20x. Разбираем, за что пользователи злятся на тарифы Claude.

3 июл.7 мин

kimiopen-source

Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic

Kimi K2.7 Code в GitHub Copilot, GLM-5.2 на трафике OpenRouter, Coinbase режет расходы вдвое. Разбираем, как открытые модели догнали закрытые.

3 июл.8 мин

Все новости

Демонстрация скорости генерации токенов

Интерактивная демка показывает разницу в скорости работы моделей. Меняй значения в полях и смотри, как это влияет на время ответа.

т/с

← Листай горизонтально для сравнения скоростей →

т/с

Значения сбрасываются каждые 15 секунд для демонстрации разных скоростей

Рейтинги LLM

Лучшие модели и API провайдеры в каждой категории

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

Anthropic

81.0

Gemini 3 Flash

Google

MiniMax M2.5

MiniMax

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

Alibaba

14450.8

Gemini 3.1 Pro

Google

94.3

GPT-5.5

OpenAI

94.0

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

Google

94.3

GPT-5.5

OpenAI

94.0

Claude Opus 4.7

Anthropic

94.0

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

Google

1.0M tokens

GPT-5.5

OpenAI

1.0M tokens

Gemini 3.1 Flash-Lite

Google

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

OpenAI

1000 tokens/s

Mistral Small 4

Mistral AI

515 tokens/s

GPT OSS 120B

OpenAI

500 tokens/s

← Листай горизонтально для просмотра всех категорий →

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

81.0

Gemini 3 Flash

MiniMax M2.5

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

14450.8

Gemini 3.1 Pro

94.3

GPT-5.5

94.0

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

94.3

GPT-5.5

94.0

Claude Opus 4.7

94.0

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

1.0M tokens

GPT-5.5

1.0M tokens

Gemini 3.1 Flash-Lite

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

$0.01 / 1M tokens

Gemma 3 4B

$0.02 / 1M tokens

Nova Micro

$0.03 / 1M tokens

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

1000 tokens/s

Mistral Small 4

515 tokens/s

GPT OSS 120B

500 tokens/s

Бенчмарки и тесты

Как понять, какая модель лучше справляется с математикой, программированием или пониманием текста? Мы собрали 300+ разных тестов. Вот некоторые из ключевых бенчмарков, которые мы используем:

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

← Листай горизонтально для просмотра всех бенчмарков →

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

Смотреть рейтинги

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Рейтинг нейросетей

Каталог нейросетей

Лучшие ИИ на июль 2026

Лучший выбор по задаче

Новости ИИ

Война за таланты: как Anthropic обгоняет OpenAI и Meta в найме

Claude Fable 5 вернулся: Anthropic снова открыла доступ по всему миру

Лимит за девять минут: бунт подписчиков Claude Max

Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic

Демонстрация скорости генерации токенов

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Бенчмарки и тесты

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

Каталог нейросетей

Лучшие ИИ на июль 2026

Лучший выбор по задаче

Новости ИИ

Война за таланты: как Anthropic обгоняет OpenAI и Meta в найме

Claude Fable 5 вернулся: Anthropic снова открыла доступ по всему миру

Лимит за девять минут: бунт подписчиков Claude Max

Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API