Qwen2.5 VL 72B Instruct
МультимодальнаяQwen2.5-VL — это новая флагманская мультимодальная языковая модель Qwen, значительно улучшенная по сравнению с Qwen2-VL. Она превосходно распознает объекты, анализирует текст, диаграммы и компоновку изображений, действует как визуальный агент, понимает длинные видео (более 1 часа) с точным определением событий, выполняет визуальную локализацию (ограничивающие рамки и точки) и генерирует структурированные выходные данные из документов.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиQwen2-VL-72B-Instruct
Alibaba
Qwen3 VL 32B Thinking
Alibaba
Qwen2.5 VL 32B Instruct
Alibaba
QvQ-72B-Preview
Alibaba
Qwen3.5-397B-A17B
Alibaba
Qwen2.5 VL 7B Instruct
Alibaba
Qwen2.5-Omni-7B
Alibaba
Qwen3-Next-80B-A3B-Instruct
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.