DeepSeek-V4-Flash-Max

Name: DeepSeek-V4-Flash-Max
Author: DeepSeek

DeepSeek

DeepSeek-V4-Flash-Max — режим максимального усилия рассуждения (maximum reasoning effort) модели DeepSeek-V4-Flash, MoE-модели на 284B параметров с 13B активированными параметрами и контекстным окном 1M токенов. Разделяет с серией V4 гибридную архитектуру внимания (Compressed Sparse Attention в сочетании с Heavily Compressed Attention), Manifold-Constrained Hyper-Connections и оптимизатор Muon. V4-Flash-Max обеспечивает производительность рассуждения, сравнимую с V4-Pro при большем бюджете мышления, при этом работая на доли параметрического масштаба. Предобучена на более чем 32T токенов и пост-обучена двухэтапной парадигмой: культивация доменных экспертов с последующей on-policy дистилляцией.

Основные характеристики

Параметры

284.0B

Контекст

1.0M

Дата выпуска

23 апреля 2026 г.

Средний балл

70.7%

API документация Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

23 апреля 2026 г.

Последнее обновление

3 мая 2026 г.

Сегодня

1 августа 2026 г.

Технические характеристики

Параметры

284.0B

Токены обучения

32.0T токенов

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.10

Выход (за 1М токенов)

$0.40

Макс. входящих токенов

1.0M

Макс. исходящих токенов

65.5K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-Bench Verified

SWE-Bench Verified — решение реальных задач из GitHub issues. • Self-reported

79.0%

Рассуждения

Логические рассуждения и анализ

GPQA

Точность GPQA Diamond. • Self-reported

88.1%

Другие тесты

Специализированные бенчмарки

Humanity's Last Exam

Точность HLE. • Self-reported

45.1%

BrowseComp

BrowseComp — навигация по интернету для поиска сложной информации. • Self-reported

73.2%

LiveCodeBench Pro

LiveCodeBench Pass@1 — оценка решения задач программирования с первой попытки. • Self-reported

92.0%

GDPval-AA

Elo рейтинг GDPval-AA — оценка экономически ценной знаниевой работы. • Self-reported

46.5%

Лицензия и метаданные

Лицензия

deepseek

Дата анонса

23 апреля 2026 г.

Последнее обновление

3 мая 2026 г.

Похожие модели

Все модели

DeepSeek-V3.2-Exp

DeepSeek

685.0B

Лучший скор:0.8 (GPQA)

Релиз:сент. 2025 г.

Цена:$0.27/1M токенов

DeepSeek-R1

DeepSeek

671.0B

Лучший скор:0.9 (MMLU)

Релиз:янв. 2025 г.

Цена:$3.00/1M токенов

DeepSeek-V2.5

DeepSeek

236.0B

Лучший скор:0.9 (HumanEval)

Релиз:май 2024 г.

Цена:$2.00/1M токенов

DeepSeek-V3.2 (Thinking)

DeepSeek

685.0B

Лучший скор:0.8 (GPQA)

Релиз:нояб. 2025 г.

Цена:$0.28/1M токенов

DeepSeek-V3.2-Speciale

DeepSeek

685.0B

Релиз:нояб. 2025 г.

Цена:$0.28/1M токенов

DeepSeek-V4-Pro-Max

DeepSeek

1.6T

Релиз:апр. 2026 г.

Цена:$1.00/1M токенов

DeepSeek-V3.2 (Non-thinking)

DeepSeek

685.0B

Релиз:нояб. 2025 г.

Цена:$0.28/1M токенов

DeepSeek-V3.1

DeepSeek

671.0B

Лучший скор:0.8 (GPQA)

Релиз:янв. 2025 г.

Цена:$0.27/1M токенов

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

DeepSeek-V4-Flash-Max

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Программирование

Рассуждения

Другие тесты

Лицензия и метаданные

Похожие модели

DeepSeek-V3.2-Exp

DeepSeek-R1

DeepSeek-V2.5

DeepSeek-V3.2 (Thinking)

DeepSeek-V3.2-Speciale

DeepSeek-V4-Pro-Max

DeepSeek-V3.2 (Non-thinking)

DeepSeek-V3.1