DeepSeek-V4-Pro-Max

Name: DeepSeek-V4-Pro-Max
Author: DeepSeek

DeepSeek

DeepSeek-V4-Pro-Max — режим максимального усилия рассуждения (maximum reasoning effort) модели DeepSeek-V4-Pro, MoE-модели на 1.6T параметров с 49B активированными параметрами и контекстным окном 1M токенов. Вводит гибридную архитектуру внимания, объединяющую Compressed Sparse Attention (CSA) и Heavily Compressed Attention (HCA), для значительно улучшенной эффективности на длинном контексте: требуется лишь 27% FLOPs single-token инференса и 10% KV-кеша по сравнению с DeepSeek-V3.2 на контексте 1M токенов. Также включает Manifold-Constrained Hyper-Connections (mHC) для стабильного распространения сигнала и обучается с оптимизатором Muon для более быстрой сходимости. Предобучен на более чем 32T токенов. V4-Pro-Max существенно продвигает open-source знаниевые возможности, достигает топового результата на коддинг-бенчмарках и сокращает разрыв с лидирующими closed-source моделями на задачах рассуждения и агентных задачах.

Основные характеристики

Параметры

1.6T

Контекст

1.0M

Дата выпуска

23 апреля 2026 г.

Средний балл

72.9%

API документация Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

23 апреля 2026 г.

Последнее обновление

3 мая 2026 г.

Сегодня

1 августа 2026 г.

Технические характеристики

Параметры

1.6T

Токены обучения

32.0T токенов

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$1.00

Выход (за 1М токенов)

$8.00

Макс. входящих токенов

1.0M

Макс. исходящих токенов

65.5K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Другие тесты

Специализированные бенчмарки

LiveCodeBench Pro

LiveCodeBench Pass@1 — оценка решения задач программирования с первой попытки. • Self-reported

94.0%

GDPval-AA

Elo рейтинг GDPval-AA — оценка знаниевой работы (юриспруденция, финансы и т.д.). • Self-reported

51.8%

Лицензия и метаданные

Лицензия

deepseek

Дата анонса

23 апреля 2026 г.

Последнее обновление

3 мая 2026 г.

Похожие модели

Все модели

DeepSeek-V3.2-Speciale

DeepSeek

685.0B

Релиз:нояб. 2025 г.

Цена:$0.28/1M токенов

DeepSeek-V3.2 (Non-thinking)

DeepSeek

685.0B

Релиз:нояб. 2025 г.

Цена:$0.28/1M токенов

DeepSeek R1 Zero

DeepSeek

671.0B

Лучший скор:0.7 (GPQA)

Релиз:янв. 2025 г.

DeepSeek-V2.5

DeepSeek

236.0B

Лучший скор:0.9 (HumanEval)

Релиз:май 2024 г.

Цена:$2.00/1M токенов

DeepSeek-V4-Flash-Max

DeepSeek

284.0B

Лучший скор:0.9 (GPQA)

Релиз:апр. 2026 г.

Цена:$0.10/1M токенов

DeepSeek-V3 0324

DeepSeek

671.0B

Лучший скор:0.7 (GPQA)

Релиз:март 2025 г.

Цена:$0.28/1M токенов

DeepSeek-R1-0528

DeepSeek

671.0B

Лучший скор:0.8 (GPQA)

Релиз:май 2025 г.

Цена:$0.70/1M токенов

DeepSeek-V3

DeepSeek

671.0B

Лучший скор:0.9 (MMLU)

Релиз:дек. 2024 г.

Цена:$0.27/1M токенов

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

DeepSeek-V4-Pro-Max

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Другие тесты

Лицензия и метаданные

Похожие модели

DeepSeek-V3.2-Speciale

DeepSeek-V3.2 (Non-thinking)

DeepSeek R1 Zero

DeepSeek-V2.5

DeepSeek-V4-Flash-Max

DeepSeek-V3 0324

DeepSeek-R1-0528

DeepSeek-V3