DeepSeek-V3.1

DeepSeek

DeepSeek-V3.1 — это гибридная модель, поддерживающая как режим мышления, так и обычный режим через разные шаблоны чата. Построена на базе DeepSeek-V3.1-Base с двухфазным расширением длинного контекста (фаза 32K: 630B токенов, фаза 128K: 209B токенов), имеет 671 миллиард параметров с 37 миллиардами активных. Ключевые улучшения включают более умный вызов инструментов через пост-обучение, повышенную эффективность мышления, достигающую сопоставимого качества с DeepSeek-R1-0528 при более быстром ответе, и формат данных UE8M0 FP8 для весов модели и активаций. Модель превосходно справляется как с задачами рассуждения (режим мышления), так и с практическими приложениями (обычный режим), с особенно сильной производительностью в агентных задачах программирования, математических соревнованиях и решении задач на основе поиска.

Основные характеристики

Параметры

671.0B

Контекст

163.8K

Дата выпуска

10 января 2025 г.

Средний балл

58.4%

API документация Исследование Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

10 января 2025 г.

Последнее обновление

15 сентября 2025 г.

Сегодня

26 октября 2025 г.

Технические характеристики

Параметры

671.0B

Токены обучения

Граница знаний

Семейство

Файн-тюнинг от

deepseek-v3

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.27

Выход (за 1М токенов)

$1.00

Макс. входящих токенов

163.8K

Макс. исходящих токенов

163.8K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-Bench Verified

Agent mode, Non-Thinking • Self-reported

66.0%

Рассуждения

Логические рассуждения и анализ

GPQA

Pass@1, Non-Thinking mode • Self-reported

74.9%

Другие тесты

Специализированные бенчмарки

MMLU-Redux

Non-Thinking mode • Self-reported

91.8%

MMLU-Pro

Non-Thinking mode • Self-reported

83.7%

Humanity's Last Exam

Pass@1, Thinking mode, text-only subset • Self-reported

15.9%

BrowseComp

Thinking mode with search agent • Self-reported

30.0%

BrowseComp-zh

Thinking mode with search agent • Self-reported

49.2%

SimpleQA

Thinking mode with search agent • Self-reported

93.4%

LiveCodeBench

Pass@1, 2408-2505, Non-Thinking mode • Self-reported

56.4%

Codeforces

Div1 Rating, Thinking mode • Self-reported

69.7%

Aider-Polyglot

Non-Thinking mode • Self-reported

68.4%

SWE-Bench Multilingual

Agent mode, Non-Thinking • Self-reported

54.5%

Terminal-Bench

Terminus 1 framework, Non-Thinking • Self-reported

31.3%

AIME 2024

Pass@1, Non-Thinking mode • Self-reported

66.3%

AIME 2025

Pass@1, Non-Thinking mode • Self-reported

49.8%

HMMT 2025

Pass@1, Non-Thinking mode • Self-reported

33.5%

Лицензия и метаданные

Лицензия

mit

Дата анонса

10 января 2025 г.

Последнее обновление

15 сентября 2025 г.

Похожие модели

Все модели

DeepSeek-V3

DeepSeek

671.0B

Лучший скор:0.9 (MMLU)

Релиз:дек. 2024 г.

Цена:$0.27/1M токенов

DeepSeek-V3.2-Exp

DeepSeek

685.0B

Лучший скор:0.8 (GPQA)

Релиз:сент. 2025 г.

Цена:$0.27/1M токенов

DeepSeek-R1

DeepSeek

671.0B

Лучший скор:0.9 (MMLU)

Релиз:янв. 2025 г.

Цена:$3.00/1M токенов

DeepSeek-V3 0324

DeepSeek

671.0B

Лучший скор:0.7 (GPQA)

Релиз:март 2025 г.

Цена:$0.28/1M токенов

DeepSeek-V2.5

DeepSeek

236.0B

Лучший скор:0.9 (HumanEval)

Релиз:май 2024 г.

Цена:$2.00/1M токенов

DeepSeek-R1-0528

DeepSeek

671.0B

Лучший скор:0.8 (GPQA)

Релиз:май 2025 г.

Цена:$0.70/1M токенов

Jamba 1.5 Large

AI21 Labs

398.0B

Лучший скор:0.9 (ARC)

Релиз:авг. 2024 г.

Цена:$2.00/1M токенов

Kimi K2-Instruct-0905

Moonshot AI

1.0T

Лучший скор:0.9 (MMLU)

Релиз:сент. 2025 г.

Цена:$0.60/1M токенов

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.