Qwen2.5 VL 72B Instruct
МультимодальнаяQwen2.5-VL — это новая флагманская мультимодальная языковая модель Qwen, значительно улучшенная по сравнению с Qwen2-VL. Она превосходно распознает объекты, анализирует текст, диаграммы и компоновку изображений, действует как визуальный агент, понимает длинные видео (более 1 часа) с точным определением событий, выполняет визуальную локализацию (ограничивающие рамки и точки) и генерирует структурированные выходные данные из документов.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиQvQ-72B-Preview
Alibaba
Qwen2-VL-72B-Instruct
Alibaba
Qwen2.5 VL 32B Instruct
Alibaba
Qwen2.5 VL 7B Instruct
Alibaba
Qwen2.5-Omni-7B
Alibaba
Qwen3 32B
Alibaba
DeepSeek VL2
DeepSeek
DeepSeek VL2 Small
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.