DeepSeek-V4-Flash-Max
DeepSeek-V4-Flash-Max — режим максимального усилия рассуждения (maximum reasoning effort) модели DeepSeek-V4-Flash, MoE-модели на 284B параметров с 13B активированными параметрами и контекстным окном 1M токенов. Разделяет с серией V4 гибридную архитектуру внимания (Compressed Sparse Attention в сочетании с Heavily Compressed Attention), Manifold-Constrained Hyper-Connections и оптимизатор Muon. V4-Flash-Max обеспечивает производительность рассуждения, сравнимую с V4-Pro при большем бюджете мышления, при этом работая на доли параметрического масштаба. Предобучена на более чем 32T токенов и пост-обучена двухэтапной парадигмой: культивация доменных экспертов с последующей on-policy дистилляцией.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Программирование
Рассуждения
Другие тесты
Лицензия и метаданные
Сравнить DeepSeek-V4-Flash-Max
Все сравненияПохожие модели
Все моделиDeepSeek-V3.2 (Thinking)
DeepSeek
DeepSeek-V3.2-Exp
DeepSeek
DeepSeek-R1
DeepSeek
DeepSeek-V2.5
DeepSeek
DeepSeek-V3.2-Speciale
DeepSeek
DeepSeek-V4-Pro-Max
DeepSeek
DeepSeek-V3.2 (Non-thinking)
DeepSeek
DeepSeek-V3.1
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.