Qwen2-VL-72B-Instruct
МультимодальнаяМодель, настроенная с помощью инструкций, крупная мультимодальная модель, которая превосходно справляется с визуальным пониманием и пошаговым рассуждением. Она поддерживает ввод изображений и видео с обработкой динамического разрешения и улучшенными позиционными эмбеддингами (M-ROPE), обеспечивая продвинутые возможности, такие как решение сложных задач, многоязычное распознавание текста на изображениях и агентное взаимодействие в видеоконтексте.
Основные характеристики
Параметры
73.4B
Контекст
-
Дата выпуска
29 августа 2024 г.
Средний балл
75.8%
Временная шкала
Ключевые даты в истории модели
Анонс
29 августа 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.
Технические характеристики
Параметры
73.4B
Токены обучения
-
Граница знаний
30 июня 2023 г.
Семейство
-
Возможности
МультимодальностьZeroEval
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Мультимодальность
Работа с изображениями и визуальными данными
ChartQA
## Оценка
AI: Вероятно, вы хотите, чтобы я оценил вашу работу или предоставил оценку по некоторой шкале. Мне нужно больше информации о том, что именно вы хотите, чтобы я оценил, и по каким критериям. • Self-reported
Другие тесты
Специализированные бенчмарки
DocVQAtest
score • Self-reported
EgoSchema
score • Self-reported
InfoVQAtest
Оценка • Self-reported
MathVista-Mini
score • Self-reported
MMBench_test
# Оценка
Оценка указывает на то, насколько хорошо модель решает проблему или задачу. Мы предоставляем несколько мер, по которым можно оценить качество решения модели:
1. **Проверенная правильность**: Является ли ответ модели правильным (проверенным человеческим оценщиком)? В некоторых случаях модель может получить полные баллы, даже если она использует другой метод решения, чем представленное решение - в других случаях, модель должна следовать определенным шагам (таким как двойная проверка, форматирование определенным образом).
2. **Полнота**: Решает ли модель задачу полностью, или только ее часть? Рассматривает ли она все возможные случаи или только некоторые из них?
3. **Эффективность**: Является ли подход модели к решению задачи эффективным? Избегает ли модель ненужных шагов?
4. **Ясность**: Является ли решение модели ясным и легким для понимания?
Часто модель будет получать более низкий балл, если она не объясняет свои шаги или не проверяет свою работу, когда это необходимо. Аналогично, модель получит более высокую оценку, если ее решение элегантно, проверено на ошибки, и она объясняет свой подход четким, последовательным образом. • Self-reported
MMMU-Pro
score • Self-reported
MMMUval
score • Self-reported
MMVetGPT4Turbo
score • Self-reported
MTVQA
score • Self-reported
MVBench
score • Self-reported
OCRBench
Оценка
AI: ChatGPT 4o • Self-reported
RealWorldQA
score • Self-reported
TextVQA
score • Self-reported
VCR_en_easy
Оценка
AI: ChatGPT (GPT-4) • Self-reported
Лицензия и метаданные
Лицензия
tongyi_qianwen
Дата анонса
29 августа 2024 г.
Последнее обновление
19 июля 2025 г.