Qwen2-VL-72B-Instruct

Name: Qwen2-VL-72B-Instruct
Author: Alibaba

Мультимодальная

Alibaba

Модель, настроенная с помощью инструкций, крупная мультимодальная модель, которая превосходно справляется с визуальным пониманием и пошаговым рассуждением. Она поддерживает ввод изображений и видео с обработкой динамического разрешения и улучшенными позиционными эмбеддингами (M-ROPE), обеспечивая продвинутые возможности, такие как решение сложных задач, многоязычное распознавание текста на изображениях и агентное взаимодействие в видеоконтексте.

Основные характеристики

Параметры

73.4B

Контекст

Дата выпуска

29 августа 2024 г.

Средний балл

75.8%

API документация Исследование Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

29 августа 2024 г.

Последнее обновление

19 июля 2025 г.

Сегодня

22 июня 2026 г.

Технические характеристики

Параметры

73.4B

Токены обучения

Граница знаний

30 июня 2023 г.

Семейство

Возможности

МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Мультимодальность

Работа с изображениями и визуальными данными

ChartQA

## Оценка AI: Вероятно, вы хотите, чтобы я оценил вашу работу или предоставил оценку по некоторой шкале. Мне нужно больше информации о том, что именно вы хотите, чтобы я оценил, и по каким критериям. • Self-reported

88.3%

Другие тесты

Специализированные бенчмарки

DocVQAtest

score • Self-reported

96.5%

EgoSchema

score • Self-reported

77.9%

InfoVQAtest

Оценка • Self-reported

84.5%

MathVista-Mini

score • Self-reported

70.5%

MMBench_test

# Оценка Оценка указывает на то, насколько хорошо модель решает проблему или задачу. Мы предоставляем несколько мер, по которым можно оценить качество решения модели: 1. **Проверенная правильность**: Является ли ответ модели правильным (проверенным человеческим оценщиком)? В некоторых случаях модель может получить полные баллы, даже если она использует другой метод решения, чем представленное решение - в других случаях, модель должна следовать определенным шагам (таким как двойная проверка, форматирование определенным образом). 2. **Полнота**: Решает ли модель задачу полностью, или только ее часть? Рассматривает ли она все возможные случаи или только некоторые из них? 3. **Эффективность**: Является ли подход модели к решению задачи эффективным? Избегает ли модель ненужных шагов? 4. **Ясность**: Является ли решение модели ясным и легким для понимания? Часто модель будет получать более низкий балл, если она не объясняет свои шаги или не проверяет свою работу, когда это необходимо. Аналогично, модель получит более высокую оценку, если ее решение элегантно, проверено на ошибки, и она объясняет свой подход четким, последовательным образом. • Self-reported

86.5%

MMMU-Pro

score • Self-reported

46.2%

MMMUval

score • Self-reported

64.5%

MMVetGPT4Turbo

score • Self-reported

74.0%

MTVQA

score • Self-reported

30.9%

MVBench

score • Self-reported

73.6%

OCRBench

Оценка AI: ChatGPT 4o • Self-reported

87.7%

RealWorldQA

score • Self-reported

77.8%

TextVQA

score • Self-reported

85.5%

VCR_en_easy

Оценка AI: ChatGPT (GPT-4) • Self-reported

91.9%

Лицензия и метаданные

Лицензия

tongyi_qianwen

Дата анонса

29 августа 2024 г.

Последнее обновление

19 июля 2025 г.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Qwen2-VL-72B-Instruct

Основные характеристики

Временная шкала

Технические характеристики

Результаты бенчмарков

Мультимодальность

Другие тесты

Лицензия и метаданные

Похожие модели

Qwen3 VL 32B Thinking

Qwen2.5 VL 72B Instruct

Qwen2.5 VL 32B Instruct

QvQ-72B-Preview

Qwen3.5-397B-A17B

Qwen3.6 Plus

Qwen2.5 VL 7B Instruct

Qwen2.5-Omni-7B