Alibaba logo

Qwen2-VL-72B-Instruct

Мультимодальная
Alibaba

Модель, настроенная с помощью инструкций, крупная мультимодальная модель, которая превосходно справляется с визуальным пониманием и пошаговым рассуждением. Она поддерживает ввод изображений и видео с обработкой динамического разрешения и улучшенными позиционными эмбеддингами (M-ROPE), обеспечивая продвинутые возможности, такие как решение сложных задач, многоязычное распознавание текста на изображениях и агентное взаимодействие в видеоконтексте.

Основные характеристики

Параметры
73.4B
Контекст
-
Дата выпуска
29 августа 2024 г.
Средний балл
75.8%

Временная шкала

Ключевые даты в истории модели
Анонс
29 августа 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
73.4B
Токены обучения
-
Граница знаний
30 июня 2023 г.
Семейство
-
Возможности
МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Мультимодальность

Работа с изображениями и визуальными данными
ChartQA
## Оценка AI: Вероятно, вы хотите, чтобы я оценил вашу работу или предоставил оценку по некоторой шкале. Мне нужно больше информации о том, что именно вы хотите, чтобы я оценил, и по каким критериям.Self-reported
88.3%

Другие тесты

Специализированные бенчмарки
DocVQAtest
scoreSelf-reported
96.5%
EgoSchema
scoreSelf-reported
77.9%
InfoVQAtest
ОценкаSelf-reported
84.5%
MathVista-Mini
scoreSelf-reported
70.5%
MMBench_test
# Оценка Оценка указывает на то, насколько хорошо модель решает проблему или задачу. Мы предоставляем несколько мер, по которым можно оценить качество решения модели: 1. **Проверенная правильность**: Является ли ответ модели правильным (проверенным человеческим оценщиком)? В некоторых случаях модель может получить полные баллы, даже если она использует другой метод решения, чем представленное решение - в других случаях, модель должна следовать определенным шагам (таким как двойная проверка, форматирование определенным образом). 2. **Полнота**: Решает ли модель задачу полностью, или только ее часть? Рассматривает ли она все возможные случаи или только некоторые из них? 3. **Эффективность**: Является ли подход модели к решению задачи эффективным? Избегает ли модель ненужных шагов? 4. **Ясность**: Является ли решение модели ясным и легким для понимания? Часто модель будет получать более низкий балл, если она не объясняет свои шаги или не проверяет свою работу, когда это необходимо. Аналогично, модель получит более высокую оценку, если ее решение элегантно, проверено на ошибки, и она объясняет свой подход четким, последовательным образом.Self-reported
86.5%
MMMU-Pro
scoreSelf-reported
46.2%
MMMUval
scoreSelf-reported
64.5%
MMVetGPT4Turbo
scoreSelf-reported
74.0%
MTVQA
scoreSelf-reported
30.9%
MVBench
scoreSelf-reported
73.6%
OCRBench
Оценка AI: ChatGPT 4oSelf-reported
87.7%
RealWorldQA
scoreSelf-reported
77.8%
TextVQA
scoreSelf-reported
85.5%
VCR_en_easy
Оценка AI: ChatGPT (GPT-4)Self-reported
91.9%

Лицензия и метаданные

Лицензия
tongyi_qianwen
Дата анонса
29 августа 2024 г.
Последнее обновление
19 июля 2025 г.