Qwen2.5 VL 7B Instruct
МультимодальнаяQwen2.5-VL — это мультимодальная языковая модель из семейства Qwen. Ключевые улучшения включают визуальное понимание (объекты, текст, диаграммы, компоновка), возможности визуального агента (использование инструментов, управление компьютером/телефоном), понимание длинных видео с определением событий, визуальную локализацию (ограничивающие рамки/точки) и генерацию структурированного вывода.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиQwen2.5-Omni-7B
Alibaba
Qwen2.5 VL 72B Instruct
Alibaba
QvQ-72B-Preview
Alibaba
Qwen2-VL-72B-Instruct
Alibaba
Qwen2.5 VL 32B Instruct
Alibaba
Qwen2.5 7B Instruct
Alibaba
Qwen2 7B Instruct
Alibaba
Qwen2.5-Coder 7B Instruct
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.