DeepSeek VL2 Small

Name: DeepSeek VL2 Small
Author: DeepSeek

Мультимодальная

DeepSeek

Продвинутая серия больших мультимодальных моделей Mixture-of-Experts (MoE) Vision-Language, которая значительно превосходит своего предшественника DeepSeek-VL. DeepSeek-VL2 демонстрирует превосходные возможности в различных задачах, включая, помимо прочего, ответы на вопросы по изображениям, оптическое распознавание символов, понимание документов/таблиц/диаграмм и визуальное заземление.

Основные характеристики

Параметры

16.0B

Контекст

Дата выпуска

13 декабря 2024 г.

Средний балл

69.6%

API документация Исследование Репозиторий Веса модели

Временная шкала

Ключевые даты в истории модели

Анонс

13 декабря 2024 г.

Последнее обновление

19 июля 2025 г.

Сегодня

22 июня 2026 г.

Технические характеристики

Параметры

16.0B

Токены обучения

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Мультимодальность

Работа с изображениями и визуальными данными

AI2D

тест • Self-reported

80.0%

ChartQA

тест • Self-reported

84.5%

DocVQA

тест • Self-reported

92.3%

MathVista

testmini • Self-reported

60.7%

MMMU

val • Self-reported

48.0%

Другие тесты

Специализированные бенчмарки

InfoVQA

тест • Self-reported

75.8%

MMBench

ru test • Self-reported

80.3%

MMBench-V1.1

cn тест • Self-reported

79.3%

MME

Standard Evaluation AI: Стандартная оценка • Self-reported

21.2%

MMStar

Стандартная оценка AI: Стандартная оценка • Self-reported

57.0%

MMT-Bench

Стандартная оценка AI: I'm an AI assistant that answers questions. • Self-reported

62.9%

OCRBench

Стандартная оценка AI: Стандартная оценка • Self-reported

83.4%

RealWorldQA

Стандартная оценка AI: ChatGPT assisted solving math problems Math problems are a significant challenge for state-of-the-art LLMs. This project studies how LLMs solve math problems. We explore direct solving and chain-of-thought (CoT) prompting, aiming to understand and improve solution approaches. Methods: 1. Direct Solving: We give the model a question and ask for an answer. 2. Chain-of-Thought (CoT): We instruct the model to break down the problem into steps. We study: - Problem solving approach (structured vs. unstructured reasoning) - Common error patterns - Reasoning path analysis - Impact of formula knowledge • Self-reported

65.4%

TextVQA

val • Self-reported

83.4%

Лицензия и метаданные

Лицензия

deepseek

Дата анонса

13 декабря 2024 г.

Последнее обновление

19 июля 2025 г.

Похожие модели

Все модели

DeepSeek VL2

DeepSeek

MM27.0B

Релиз:дек. 2024 г.

Цена:$9.50/1M токенов

DeepSeek VL2 Tiny

DeepSeek

MM3.0B

Релиз:дек. 2024 г.

DeepSeek R1 Distill Qwen 14B

DeepSeek

14.8B

Лучший скор:0.6 (GPQA)

Релиз:янв. 2025 г.

DeepSeek R1 Distill Llama 70B

DeepSeek

70.6B

Лучший скор:0.7 (GPQA)

Релиз:янв. 2025 г.

Цена:$0.10/1M токенов

DeepSeek R1 Distill Qwen 32B

DeepSeek

32.8B

Лучший скор:0.6 (GPQA)

Релиз:янв. 2025 г.

Цена:$0.12/1M токенов

Qwen3 VL 32B Thinking

Alibaba

MM33.0B

Релиз:сент. 2025 г.

Gemma 4 26B-A4B

Google

MM25.2B

Лучший скор:0.8 (GPQA)

Релиз:апр. 2026 г.

Цена:$0.13/1M токенов

Gemma 4 31B

Google

MM30.7B

Лучший скор:0.8 (GPQA)

Релиз:апр. 2026 г.

Цена:$0.13/1M токенов

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

DeepSeek VL2 Small

Основные характеристики

Временная шкала

Технические характеристики

Результаты бенчмарков

Мультимодальность

Другие тесты

Лицензия и метаданные

Похожие модели

DeepSeek VL2

DeepSeek VL2 Tiny

DeepSeek R1 Distill Qwen 14B

DeepSeek R1 Distill Llama 70B

DeepSeek R1 Distill Qwen 32B

Qwen3 VL 32B Thinking

Gemma 4 26B-A4B

Gemma 4 31B