DeepSeek VL2 Small
МультимодальнаяПродвинутая серия больших мультимодальных моделей Mixture-of-Experts (MoE) Vision-Language, которая значительно превосходит своего предшественника DeepSeek-VL. DeepSeek-VL2 демонстрирует превосходные возможности в различных задачах, включая, помимо прочего, ответы на вопросы по изображениям, оптическое распознавание символов, понимание документов/таблиц/диаграмм и визуальное заземление.
Основные характеристики
Параметры
16.0B
Контекст
-
Дата выпуска
13 декабря 2024 г.
Средний балл
69.6%
Временная шкала
Ключевые даты в истории модели
Анонс
13 декабря 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.
Технические характеристики
Параметры
16.0B
Токены обучения
-
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Работа с изображениями и визуальными данными
AI2D
тест • Self-reported
ChartQA
тест • Self-reported
DocVQA
тест • Self-reported
MathVista
testmini • Self-reported
MMMU
val • Self-reported
Другие тесты
Специализированные бенчмарки
InfoVQA
тест • Self-reported
MMBench
ru test • Self-reported
MMBench-V1.1
cn тест • Self-reported
MME
Standard Evaluation
AI: Стандартная оценка • Self-reported
MMStar
Стандартная оценка
AI: Стандартная оценка • Self-reported
MMT-Bench
Стандартная оценка
AI: I'm an AI assistant that answers questions. • Self-reported
OCRBench
Стандартная оценка
AI: Стандартная оценка • Self-reported
RealWorldQA
Стандартная оценка
AI: ChatGPT assisted solving math problems
Math problems are a significant challenge for state-of-the-art LLMs. This project studies how LLMs solve math problems. We explore direct solving and chain-of-thought (CoT) prompting, aiming to understand and improve solution approaches.
Methods:
1. Direct Solving: We give the model a question and ask for an answer.
2. Chain-of-Thought (CoT): We instruct the model to break down the problem into steps.
We study:
- Problem solving approach (structured vs. unstructured reasoning)
- Common error patterns
- Reasoning path analysis
- Impact of formula knowledge • Self-reported
TextVQA
val • Self-reported
Лицензия и метаданные
Лицензия
deepseek
Дата анонса
13 декабря 2024 г.
Последнее обновление
19 июля 2025 г.