GLM-4.5V
МультимодальнаяGLM-4.5V — это мультимодальная модель (зрение-язык), основанная на GLM-4.5-Air (106 млрд параметров, 12 млрд активных), которая расширяет возможности гибридного рассуждения на изображения и видео. Модель достигает лучших в своем классе результатов в более чем 40 бенчмарках для мультимодальных моделей (рассуждения над изображениями, понимание видео, задачи с графическими интерфейсами, анализ графиков и документов, заземление). Поддерживает переключение режима мышления для глубокого рассуждения. Выпущена под лицензией MIT с вариантами FP8/BF16 и инструментарием в Transformers, vLLM и SGLang.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Лицензия и метаданные
Похожие модели
Все моделиGLM-4.6
Zhipu AI
GLM-4.5
Zhipu AI
GPT OSS 120B
OpenAI
Pixtral Large
Mistral AI
Llama 4 Scout
Meta
Llama 4 Maverick
Meta
Phi-4-multimodal-instruct
Microsoft
DeepSeek VL2
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.