Рейтинг нейросетей

Сравнивай модели, бенчмарки и цены. Быстро находи лучшее под твои задачи.

Смотреть модели Бенчмарки

Обновлено: 24 февраляРейтинг моделей и их параметров

Мы фокусируемся на том, чтобы предоставить вам наиболее точные и актуальные данные от лучших разработчиков ИИ

OpenAI

Anthropic

Google

Каталог нейросетей

Топ моделей по дате выхода — новейшие разработки AI-компаний

Показано 1-10 из 217

#
1	Google	Gemini 3.1 Pro	1049K	19 февр. 2026 г.	1 янв. 2025 г.	-	Да	2.50	15.00	-	94.3%	-	80.6%	-	-	-
2	Anthropic	Claude Sonnet 4.6	200K	17 февр. 2026 г.	-	-	Да	3.00	15.00	-	89.9%	-	79.6%	-	-	-
3	Alibaba	Qwen3.5-397B-A17B	-	15 февр. 2026 г.	-	397.0B	Да	-	-	-	-	-	-	-	-	-
4	MiniMax	MiniMax M2.5	-	11 февр. 2026 г.	-	230.0B	Да	-	-	-	-	-	80.0%	-	-	-
5	Zhipu AI	GLM-5	200K	10 февр. 2026 г.	-	744.0B	Нет	0.00	0.00	-	-	-	78.0%	-	90.0%	-
6	Anthropic	Claude Opus 4.6	1000K	4 февр. 2026 г.	1 мая 2025 г.	-	Да	5.00	25.00	-	91.3%	-	78.0%	-	99.0%	-
7	Meituan	LongCat-Flash-Lite	-	4 февр. 2026 г.	-	68.5B	Нет	-	-	86.0%	66.8%	-	-	-	73.0%	-
8	StepFun	Step-3.5-Flash	66K	1 февр. 2026 г.	-	196.0B	Да	0.10	0.40	-	-	-	74.0%	-	88.0%	-
9	Moonshot AI	Kimi K2.5	-	26 янв. 2026 г.	-	1000.0B	Да	-	-	-	87.6%	-	-	-	-	-
10	Zhipu AI	GLM-4.7-Flash	128K	18 янв. 2026 г.	-	30.0B	Нет	0.07	0.40	-	75.0%	-	59.0%	-	80.0%	-

Страница 1 из 22

Смотреть все текстовые модели →

Лучшие ИИ на февраль 2026

Рейтинг составлен на основе 6 ключевых бенчмарков: GPQA, SWE-Bench, HumanEval, Tau2, MMLU и ARC

HumanEval 92%MMLU 84%

Tau2 99%GPQA 91%SWE-Bench 78%

GPQA 94%SWE-Bench 81%

88.2%

общий рейтинг

Лучший выбор по задаче

Llama 3.2 3B Instruct

← Листай для просмотра категорий →

Llama 3.2 3B Instruct

Как мы считаем общий рейтинг

GPQA(25%)+SWE-Bench(20%)+HumanEval(20%)+Tau2(15%)+MMLU(10%)+ARC(10%)

Веса нормализуются по доступным данным. Модели с менее чем 2 бенчмарками не включаются в рейтинг.

Лучшие нейросети 2026 года отличаются высокой точностью в специализированных задачах: от написания кода до анализа документов. Мы ежемесячно обновляем рейтинг, чтобы вы могли выбрать оптимальную модель под свои задачи — будь то разработка, исследования или автоматизация рутинных процессов.

Новости ИИ

Последние события, новинки и горячие новости про нейросети

Все новости

anthropicclaude

Claude Code Security обрушил акции кибербезопасности на $15 млрд

Anthropic встроила AI-сканер уязвимостей в Claude Code. За один день акции CrowdStrike, Cloudflare, Palo Alto Networks и других упали суммарно на $15+ млрд.

Сегодня8 мин

deepseeknasdaq

DeepSeek готовит новую модель — рынки напряглись

CNBC сообщает о скором релизе DeepSeek V4. Аналитики предупреждают о возможном повторении январского обвала Nasdaq 2025 года.

Сегодня2 мин

open-sourcelocalllama

Shade — фрод разоблачён сообществом LocalLLaMA

Reddit-сообщество r/LocalLLaMA разоблачило софт Shade как плагиат проекта Heretic. 95% кода украдено, заменено только название.

Сегодня2 мин

openaiэнергопотребление

Альтман сравнил энергозатраты AI и людей — интернет в ярости

Сэм Альтман на India AI Summit заявил, что сравнения энергопотребления AI «нечестны», и предложил учитывать эволюционные затраты на обучение человека.

Вчера7 мин

Все новости

Демонстрация скорости генерации токенов

Интерактивная демка показывает разницу в скорости работы моделей. Меняй значения в полях и смотри, как это влияет на время ответа.

т/с

← Листай горизонтально для сравнения скоростей →

т/с

Значения сбрасываются каждые 15 секунд для демонстрации разных скоростей

Рейтинги LLM

Лучшие модели и API провайдеры в каждой категории

Лучшая модель - Код

Бенчмарк SWE-Bench

Kimi K2 0905

Moonshot AI

94.5

Kimi K2 Instruct

Moonshot AI

93.3

Phi 4 Reasoning

Microsoft

92.9

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

Alibaba

14450.8

GPT-5

OpenAI

98.0

GPT-5

OpenAI

97.0

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

Google

94.3

GPT-5

OpenAI

92.0

Gemini 3 Pro

Google

92.0

Самый длинный контекст

Максимум входных токенов

Llama 4 Scout

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

OpenAI

1000 tokens/s

GPT-5

OpenAI

500 tokens/s

GPT OSS 120B

OpenAI

500 tokens/s

← Листай горизонтально для просмотра всех категорий →

Лучшая модель - Код

Бенчмарк SWE-Bench

Kimi K2 0905

94.5

Kimi K2 Instruct

93.3

Phi 4 Reasoning

92.9

Лучшая мультимодальная модель

Мультимодальные с лучшим GPQA

Qwen3 VL 32B Thinking

14450.8

GPT-5

98.0

GPT-5

97.0

Лучшая модель - Знания

Бенчмарк GPQA

Gemini 3.1 Pro

94.3

GPT-5

92.0

Gemini 3 Pro

92.0

Самый длинный контекст

Максимум входных токенов

Llama 4 Scout

10.0M tokens

Gemini 1.5 Pro

2.1M tokens

Grok 4 Fast

2.0M tokens

Самый дешевый API

Стоимость входных токенов

Llama 3.2 3B Instruct

$0.01 / 1M tokens

Gemma 3 4B

$0.02 / 1M tokens

Nova Micro

$0.03 / 1M tokens

Самый быстрый API

Пропускная способность (tok/s)

GPT OSS 20B

1000 tokens/s

GPT-5

500 tokens/s

GPT OSS 120B

500 tokens/s

Бенчмарки и тесты

Как понять, какая модель лучше справляется с математикой, программированием или пониманием текста? Мы собрали 300+ разных тестов. Вот некоторые из ключевых бенчмарков, которые мы используем:

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

← Листай горизонтально для просмотра всех бенчмарков →

MMLU

Знания

Тест на понимание языка и широкие знания в 57 предметах

HumanEval

Программирование

Решение задач по программированию на Python

GPQA

Наука

Вопросы уровня PhD по физике, химии и биологии

ARC

Рассуждения

Логические задачи для школьников на рассуждения

SWE-Bench

Инженерия

Реальные задачи разработки программного обеспечения

MMMU

Мультимодальность

Мультимодальные задачи на понимание изображений и текста

GSM8K

Математика

Математические задачи уровня начальной школы

HellaSwag

Понимание

Тест на здравый смысл и понимание контекста

Arena Hard

Диалоги

Сложные задачи из пользовательских запросов

ComplexFuncBench

Tool Calling

Сложные сценарии вызова функций с многоступенчатыми задачами

Tau2

Tool Calling

Комплексные сценарии вызова инструментов с множественными параметрами

ToolBench

Tool Calling

Практические задачи использования API в реальных сценариях

Смотреть рейтинги

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Рейтинг нейросетей

Каталог нейросетей

Лучшие ИИ на февраль 2026

Лучший выбор по задаче

Новости ИИ

Claude Code Security обрушил акции кибербезопасности на $15 млрд

DeepSeek готовит новую модель — рынки напряглись

Shade — фрод разоблачён сообществом LocalLLaMA

Альтман сравнил энергозатраты AI и людей — интернет в ярости

Демонстрация скорости генерации токенов

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Бенчмарки и тесты

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

MMLU

HumanEval

GPQA

ARC

SWE-Bench

MMMU

GSM8K

HellaSwag

Arena Hard

ComplexFuncBench

Tau2

ToolBench

Каталог нейросетей

Лучшие ИИ на февраль 2026

Лучший выбор по задаче

Новости ИИ

Claude Code Security обрушил акции кибербезопасности на $15 млрд

DeepSeek готовит новую модель — рынки напряглись

Shade — фрод разоблачён сообществом LocalLLaMA

Альтман сравнил энергозатраты AI и людей — интернет в ярости

Рейтинги LLM

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API

Лучшая модель - Код

Лучшая мультимодальная модель

Лучшая модель - Знания

Самый длинный контекст

Самый дешевый API

Самый быстрый API