DeepSeek-V4-Pro-Max
DeepSeek-V4-Pro-Max — режим максимального усилия рассуждения (maximum reasoning effort) модели DeepSeek-V4-Pro, MoE-модели на 1.6T параметров с 49B активированными параметрами и контекстным окном 1M токенов. Вводит гибридную архитектуру внимания, объединяющую Compressed Sparse Attention (CSA) и Heavily Compressed Attention (HCA), для значительно улучшенной эффективности на длинном контексте: требуется лишь 27% FLOPs single-token инференса и 10% KV-кеша по сравнению с DeepSeek-V3.2 на контексте 1M токенов. Также включает Manifold-Constrained Hyper-Connections (mHC) для стабильного распространения сигнала и обучается с оптимизатором Muon для более быстрой сходимости. Предобучен на более чем 32T токенов. V4-Pro-Max существенно продвигает open-source знаниевые возможности, достигает топового результата на коддинг-бенчмарках и сокращает разрыв с лидирующими closed-source моделями на задачах рассуждения и агентных задачах.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Другие тесты
Лицензия и метаданные
Сравнить DeepSeek-V4-Pro-Max
Все сравненияПохожие модели
Все моделиDeepSeek-V3.2-Speciale
DeepSeek
DeepSeek-V3.2 (Non-thinking)
DeepSeek
DeepSeek-V3.2 (Thinking)
DeepSeek
DeepSeek R1 Zero
DeepSeek
DeepSeek-V2.5
DeepSeek
DeepSeek-V4-Flash-Max
DeepSeek
DeepSeek-V3 0324
DeepSeek
DeepSeek-R1-0528
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.