DeepSeek logo

DeepSeek-V3.1

DeepSeek

DeepSeek-V3.1 — это гибридная модель, поддерживающая как режим мышления, так и обычный режим через разные шаблоны чата. Построена на базе DeepSeek-V3.1-Base с двухфазным расширением длинного контекста (фаза 32K: 630B токенов, фаза 128K: 209B токенов), имеет 671 миллиард параметров с 37 миллиардами активных. Ключевые улучшения включают более умный вызов инструментов через пост-обучение, повышенную эффективность мышления, достигающую сопоставимого качества с DeepSeek-R1-0528 при более быстром ответе, и формат данных UE8M0 FP8 для весов модели и активаций. Модель превосходно справляется как с задачами рассуждения (режим мышления), так и с практическими приложениями (обычный режим), с особенно сильной производительностью в агентных задачах программирования, математических соревнованиях и решении задач на основе поиска.

Основные характеристики

Параметры
671.0B
Контекст
163.8K
Дата выпуска
10 января 2025 г.
Средний балл
58.4%

Временная шкала

Ключевые даты в истории модели
Анонс
10 января 2025 г.
Последнее обновление
15 сентября 2025 г.
Сегодня
26 октября 2025 г.

Технические характеристики

Параметры
671.0B
Токены обучения
-
Граница знаний
-
Семейство
-
Файн-тюнинг от
deepseek-v3
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$0.27
Выход (за 1М токенов)
$1.00
Макс. входящих токенов
163.8K
Макс. исходящих токенов
163.8K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования
SWE-Bench Verified
Agent mode, Non-ThinkingSelf-reported
66.0%

Рассуждения

Логические рассуждения и анализ
GPQA
Pass@1, Non-Thinking modeSelf-reported
74.9%

Другие тесты

Специализированные бенчмарки
MMLU-Redux
Non-Thinking modeSelf-reported
91.8%
MMLU-Pro
Non-Thinking modeSelf-reported
83.7%
Humanity's Last Exam
Pass@1, Thinking mode, text-only subsetSelf-reported
15.9%
BrowseComp
Thinking mode with search agentSelf-reported
30.0%
BrowseComp-zh
Thinking mode with search agentSelf-reported
49.2%
SimpleQA
Thinking mode with search agentSelf-reported
93.4%
LiveCodeBench
Pass@1, 2408-2505, Non-Thinking modeSelf-reported
56.4%
Codeforces
Div1 Rating, Thinking modeSelf-reported
69.7%
Aider-Polyglot
Non-Thinking modeSelf-reported
68.4%
SWE-Bench Multilingual
Agent mode, Non-ThinkingSelf-reported
54.5%
Terminal-Bench
Terminus 1 framework, Non-ThinkingSelf-reported
31.3%
AIME 2024
Pass@1, Non-Thinking modeSelf-reported
66.3%
AIME 2025
Pass@1, Non-Thinking modeSelf-reported
49.8%
HMMT 2025
Pass@1, Non-Thinking modeSelf-reported
33.5%

Лицензия и метаданные

Лицензия
mit
Дата анонса
10 января 2025 г.
Последнее обновление
15 сентября 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.