DeepSeek VL2
МультимодальнаяПродвинутая серия больших мультимодальных моделей Vision-Language на основе архитектуры Mixture-of-Experts (MoE), которая значительно превосходит свою предшественницу DeepSeek-VL. DeepSeek-VL2 демонстрирует превосходные возможности в различных задачах, включая, помимо прочего, ответы на визуальные вопросы, оптическое распознавание символов, понимание документов/таблиц/диаграмм и визуальную локализацию.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek VL2 Small
DeepSeek
DeepSeek VL2 Tiny
DeepSeek
DeepSeek R1 Distill Qwen 14B
DeepSeek
DeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
Qwen2-VL-72B-Instruct
Alibaba
Llama 3.2 90B Instruct
Meta
Qwen2.5 VL 72B Instruct
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.