DeepSeek VL2
МультимодальнаяПродвинутая серия больших мультимодальных моделей Vision-Language на основе архитектуры Mixture-of-Experts (MoE), которая значительно превосходит свою предшественницу DeepSeek-VL. DeepSeek-VL2 демонстрирует превосходные возможности в различных задачах, включая, помимо прочего, ответы на визуальные вопросы, оптическое распознавание символов, понимание документов/таблиц/диаграмм и визуальную локализацию.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиGemma 3 12B
DeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
Llama 3.2 90B Instruct
Meta
Gemma 3 27B
Llama 3.2 11B Instruct
Meta
Mistral Small 3.1 24B Base
Mistral AI
GPT OSS 20B
OpenAI
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.