Llama 3.2 11B Instruct
МультимодальнаяLlama 3.2 11B Vision Instruct — это настроенная на инструкции мультимодальная большая языковая модель, оптимизированная для визуального распознавания, анализа изображений, создания описаний и ответов на общие вопросы об изображениях. Модель принимает текст и изображения на входе и генерирует текст на выходе.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Общие знания
Математика
Рассуждения
Мультимодальность
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиLlama 3.2 90B Instruct
Meta
Llama 4 Maverick
Meta
Llama 4 Scout
Meta
Llama 3.1 70B Instruct
Meta
Llama 3.3 70B Instruct
Meta
DeepSeek VL2
DeepSeek
DeepSeek VL2 Small
DeepSeek
Qwen2.5 VL 72B Instruct
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.