DeepSeek-V3.1
DeepSeek-V3.1 — это гибридная модель, поддерживающая как режим мышления, так и обычный режим через разные шаблоны чата. Построена на базе DeepSeek-V3.1-Base с двухфазным расширением длинного контекста (фаза 32K: 630B токенов, фаза 128K: 209B токенов), имеет 671 миллиард параметров с 37 миллиардами активных. Ключевые улучшения включают более умный вызов инструментов через пост-обучение, повышенную эффективность мышления, достигающую сопоставимого качества с DeepSeek-R1-0528 при более быстром ответе, и формат данных UE8M0 FP8 для весов модели и активаций. Модель превосходно справляется как с задачами рассуждения (режим мышления), так и с практическими приложениями (обычный режим), с особенно сильной производительностью в агентных задачах программирования, математических соревнованиях и решении задач на основе поиска.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Программирование
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek-V3
DeepSeek
DeepSeek-V3.2-Exp
DeepSeek
DeepSeek-R1
DeepSeek
DeepSeek-V3 0324
DeepSeek
DeepSeek-V2.5
DeepSeek
DeepSeek-R1-0528
DeepSeek
Jamba 1.5 Large
AI21 Labs
Kimi K2-Instruct-0905
Moonshot AI
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.