Zhipu AI logo

GLM-4.5-Air

Zhipu AI

GLM-4.5-Air — это более компактный вариант GLM-4.5, разработанный для эффективных приложений агентного ИИ, рассуждений и программирования (ARC). Модель имеет 106 миллиардов параметров с 12 миллиардами активных параметров благодаря архитектуре MoE. Как и GLM-4.5, это гибридная модель рассуждений, предоставляющая режим мышления для сложных рассуждений и использования инструментов, и обычный режим для немедленных ответов. Несмотря на компактный дизайн, GLM-4.5-Air обеспечивает конкурентоспособную производительность с оценкой 59.8 по 12 отраслевым бенчмаркам, занимая 6-е место в общем рейтинге при сохранении превосходной эффективности. Поддерживает контекст 128K токенов и выпущена под лицензией MIT с открытым исходным кодом, разрешающей коммерческое использование.

Основные характеристики

Параметры
106.0B
Контекст
-
Дата выпуска
28 июля 2025 г.
Средний балл
60.8%

Временная шкала

Ключевые даты в истории модели
Анонс
28 июля 2025 г.
Последнее обновление
15 сентября 2025 г.
Сегодня
26 октября 2025 г.

Технические характеристики

Параметры
106.0B
Токены обучения
-
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования
SWE-bench-Verified
OpenHands v0.34.0Self-reported
57.6%

Рассуждения

Логические рассуждения и анализ
GPQA
Avg@8Self-reported
75.0%

Другие тесты

Специализированные бенчмарки
MMLU-Pro
standardSelf-reported
81.4%
AIME24
Avg@32Self-reported
89.4%
MATH-500
standardSelf-reported
98.1%
SciCode
standardSelf-reported
37.3%
LiveCodeBench
2407-2501Self-reported
70.7%
TAU-bench-Retail
optimized user simulatorSelf-reported
77.9%
BFCL-v3
FullSelf-reported
76.4%
TAU-bench-Airline
optimized user simulatorSelf-reported
60.8%
BrowseComp
standardSelf-reported
21.3%
HLE
text-based questions onlySelf-reported
10.6%
AA-Index
EstimatedSelf-reported
64.8%
Terminal-Bench
Terminus frameworkSelf-reported
30.0%

Лицензия и метаданные

Лицензия
mit
Дата анонса
28 июля 2025 г.
Последнее обновление
15 сентября 2025 г.