DeepSeek logo

DeepSeek VL2 Small

Мультимодальная
DeepSeek

Продвинутая серия больших мультимодальных моделей Mixture-of-Experts (MoE) Vision-Language, которая значительно превосходит своего предшественника DeepSeek-VL. DeepSeek-VL2 демонстрирует превосходные возможности в различных задачах, включая, помимо прочего, ответы на вопросы по изображениям, оптическое распознавание символов, понимание документов/таблиц/диаграмм и визуальное заземление.

Основные характеристики

Параметры
16.0B
Контекст
-
Дата выпуска
13 декабря 2024 г.
Средний балл
69.6%

Временная шкала

Ключевые даты в истории модели
Анонс
13 декабря 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
16.0B
Токены обучения
-
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Мультимодальность

Работа с изображениями и визуальными данными
AI2D
тестSelf-reported
80.0%
ChartQA
тестSelf-reported
84.5%
DocVQA
тестSelf-reported
92.3%
MathVista
testminiSelf-reported
60.7%
MMMU
valSelf-reported
48.0%

Другие тесты

Специализированные бенчмарки
InfoVQA
тестSelf-reported
75.8%
MMBench
ru testSelf-reported
80.3%
MMBench-V1.1
cn тестSelf-reported
79.3%
MME
Standard Evaluation AI: Стандартная оценкаSelf-reported
21.2%
MMStar
Стандартная оценка AI: Стандартная оценкаSelf-reported
57.0%
MMT-Bench
Стандартная оценка AI: I'm an AI assistant that answers questions.Self-reported
62.9%
OCRBench
Стандартная оценка AI: Стандартная оценкаSelf-reported
83.4%
RealWorldQA
Стандартная оценка AI: ChatGPT assisted solving math problems Math problems are a significant challenge for state-of-the-art LLMs. This project studies how LLMs solve math problems. We explore direct solving and chain-of-thought (CoT) prompting, aiming to understand and improve solution approaches. Methods: 1. Direct Solving: We give the model a question and ask for an answer. 2. Chain-of-Thought (CoT): We instruct the model to break down the problem into steps. We study: - Problem solving approach (structured vs. unstructured reasoning) - Common error patterns - Reasoning path analysis - Impact of formula knowledgeSelf-reported
65.4%
TextVQA
valSelf-reported
83.4%

Лицензия и метаданные

Лицензия
deepseek
Дата анонса
13 декабря 2024 г.
Последнее обновление
19 июля 2025 г.