Рейтинг нейросетей

Сравнивай модели, бенчмарки и цены. Быстро находи лучшее под твои задачи.

Смотреть модели Бенчмарки

Обновлено: 2 августаРейтинг моделей и их параметров

Мы фокусируемся на том, чтобы предоставить вам наиболее точные и актуальные данные от лучших разработчиков ИИ

OpenAI

Anthropic

Google

Каталог нейросетей

Топ моделей по дате выхода — новейшие разработки AI-компаний

Показано 1-10 из 274

#
1	Anthropic	Claude Opus 5	1000K	24 июл. 2026 г.	-	-	Да	5.00	25.00	-	-	-	-	-	-	-
2	Google	Gemini 3.6 Flash	1000K	21 июл. 2026 г.	1 мар. 2026 г.	-	Да	1.50	7.50	-	-	-	-	-	-	-
3	Google	Gemini 3.5 Flash-Lite	1000K	21 июл. 2026 г.	1 мар. 2026 г.	-	Да	0.30	2.50	-	-	-	-	-	-	-
4	Moonshot AI	Kimi K3	1000K	16 июл. 2026 г.	-	2800.0B	Да	3.00	15.00	-	93.5%	-	-	-	-	-
5	xAI	Grok 4.5	1000K	16 июл. 2026 г.	28 февр. 2026 г.	-	Да	2.00	6.00	-	93.0%	-	-	-	-	-
6	Meta	Muse Spark 1.1	1000K	9 июл. 2026 г.	-	-	Да	1.25	4.25	-	-	-	-	-	-	-
7	OpenAI	GPT-5.6 Terra	400K	9 июл. 2026 г.	28 февр. 2026 г.	-	Да	2.50	15.00	-	92.9%	-	-	-	-	-
8	OpenAI	GPT-5.6 Sol	400K	9 июл. 2026 г.	28 февр. 2026 г.	-	Да	5.00	30.00	-	94.6%	-	-	-	-	-
9	OpenAI	GPT-5.6 Luna	400K	9 июл. 2026 г.	28 февр. 2026 г.	-	Да	1.00	6.00	-	92.3%	-	-	-	-	-
10	Anthropic	Claude Sonnet 5	1000K	30 июн. 2026 г.	-	-	Да	3.00	15.00	-	-	-	-	-	-	-

Страница 1 из 28

Смотреть все текстовые модели →

Лучшие ИИ на август 2026

Рейтинг составлен на основе 6 ключевых бенчмарков: GPQA, SWE-Bench, Tau2, MMLU, MMMU-Pro и ARC-AGI

Gemini 3.1 Pro

Google

GPQA 94%SWE-Bench 81%

Tau2 99%GPQA 91%SWE-Bench 78%

GPQA 90%SWE-Bench 80%

85.3%

общий рейтинг

Лучший выбор по задаче

Llama 3.2 3B Instruct

← Листай для просмотра категорий →

Llama 3.2 3B Instruct

Как мы считаем общий рейтинг

GPQA(20%)+SWE-Bench(20%)+Tau2(20%)+MMLU(15%)+MMMU-Pro(15%)+ARC-AGI(10%)

Веса нормализуются по доступным данным. Модели с менее чем 2 бенчмарками не включаются в рейтинг.

Лучшие нейросети 2026 года отличаются высокой точностью в специализированных задачах: от написания кода до анализа документов. Мы ежемесячно обновляем рейтинг, чтобы вы могли выбрать оптимальную модель под свои задачи — будь то разработка, исследования или автоматизация рутинных процессов.

Новости ИИ

Последние события, новинки и горячие новости про нейросети

Все новости

anthropicclaude

Как Claude случайно взломал три настоящие компании

Anthropic проверила 141 006 своих кибертестов и нашла шесть прогонов, где Claude вышел из песочницы в живой интернет и взломал реальные фирмы. Разбираем инцидент.

Вчера8 мин

релизdeepseek

DeepSeek V4 Flash вышел из превью — ответ на демпинг OpenAI

DeepSeek официально выпустила V4 Flash «0731»: та же архитектура на 284B параметров, но переобученная под агентные задачи. Набор 50 баллов в индексе Artificial Analysis — на пункт ниже GPT-5.6 Luna.

Вчера6 мин

googlegoogle-earth

Google Earth научили рисовать фейки — и через день откатили

Google добавила в Google Earth ИИ-генерацию спутниковых снимков, но откатила функцию за сутки: исследователи мгновенно создали фейковые пожары в Иране и потоп у Капитолия.

Вчера3 мин

openaigpt-5.6

OpenAI срезала цену Luna на 80% — и это признание слабости

OpenAI обвалила цену GPT-5.6 Luna на 80% и Terra на 20% через три недели после запуска. Разбираем ценовую войну с DeepSeek и Google в таблице тарифов за миллион токенов.

Вчера7 мин

Все новости

Демонстрация скорости генерации токенов

Интерактивная демка показывает разницу в скорости работы моделей. Меняй значения в полях и смотри, как это влияет на время ответа.

т/с

← Листай горизонтально для сравнения скоростей →

т/с

Значения сбрасываются каждые 15 секунд для демонстрации разных скоростей

Рейтинги LLM

Лучшие модели и API провайдеры в каждой категории

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

Anthropic

81.0

Gemini 3 Flash

Google

MiniMax M2.5

MiniMax

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

Alibaba

14450.8

Gemini 3.1 Pro

Google

94.3

Kimi K3

Moonshot AI

93.5

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

Google

94.3

Kimi K3

Moonshot AI

93.5

Grok 4.5

xAI

93.0

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

Google

1.0M tokens

GLM-5.2

Zhipu AI

1.0M tokens

Gemini 3.6 Flash

Google

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

OpenAI

1000 tokens/s

Mistral Small 4

Mistral AI

515 tokens/s

GPT OSS 120B

OpenAI

500 tokens/s

← Листай горизонтально для просмотра всех категорий →

Лучшая модель - Код

Бенчмарк SWE-Bench

Claude Opus 4.5

81.0

Gemini 3 Flash

MiniMax M2.5

80.0

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

14450.8

Gemini 3.1 Pro

94.3

Kimi K3

93.5

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

94.3

Kimi K3

93.5

Grok 4.5

93.0

Самый длинный контекст

Максимум входных токенов

Gemini 3.1 Pro

1.0M tokens

GLM-5.2

1.0M tokens

Gemini 3.6 Flash

1.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

$0.01 / 1M tokens

Gemma 3 4B

$0.02 / 1M tokens

Nova Micro

$0.03 / 1M tokens

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

1000 tokens/s

Mistral Small 4

515 tokens/s

GPT OSS 120B

500 tokens/s

Бенчмарки и тесты

Как понять, какая модель лучше справляется с математикой, программированием или пониманием текста? Мы собрали 300+ разных тестов. Вот некоторые из ключевых бенчмарков, которые мы используем:

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

← Листай горизонтально для просмотра всех бенчмарков →

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

Смотреть рейтинги

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Рейтинг нейросетей

Каталог нейросетей

Лучшие ИИ на август 2026

Лучший выбор по задаче

Новости ИИ

Как Claude случайно взломал три настоящие компании

DeepSeek V4 Flash вышел из превью — ответ на демпинг OpenAI

Google Earth научили рисовать фейки — и через день откатили

OpenAI срезала цену Luna на 80% — и это признание слабости

Демонстрация скорости генерации токенов

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Бенчмарки и тесты

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

Каталог нейросетей

Лучшие ИИ на август 2026

Лучший выбор по задаче

Новости ИИ

Как Claude случайно взломал три настоящие компании

DeepSeek V4 Flash вышел из превью — ответ на демпинг OpenAI

Google Earth научили рисовать фейки — и через день откатили

OpenAI срезала цену Luna на 80% — и это признание слабости

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API