Qwen2.5 VL 32B Instruct
МультимодальнаяQwen2.5-VL — это мультимодальная языковая модель из семейства Qwen. Ключевые улучшения включают понимание визуальной информации (объекты, текст, диаграммы, макеты), возможности визуального агента (использование инструментов, управление компьютером/телефоном), понимание длинных видео с определением событий, визуальную локализацию (ограничивающие рамки/точки) и генерацию структурированного вывода.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Общие знания
Программирование
Математика
Рассуждения
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиQvQ-72B-Preview
Alibaba
Qwen2-VL-72B-Instruct
Alibaba
Qwen2.5 VL 72B Instruct
Alibaba
Qwen2.5-Coder 32B Instruct
Alibaba
Qwen2 72B Instruct
Alibaba
Qwen2.5 14B Instruct
Alibaba
Gemma 3 27B
GPT OSS 20B
OpenAI
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.