GLM-4.5-Air

Zhipu AI

GLM-4.5-Air — это более компактный вариант GLM-4.5, разработанный для эффективных приложений агентного ИИ, рассуждений и программирования (ARC). Модель имеет 106 миллиардов параметров с 12 миллиардами активных параметров благодаря архитектуре MoE. Как и GLM-4.5, это гибридная модель рассуждений, предоставляющая режим мышления для сложных рассуждений и использования инструментов, и обычный режим для немедленных ответов. Несмотря на компактный дизайн, GLM-4.5-Air обеспечивает конкурентоспособную производительность с оценкой 59.8 по 12 отраслевым бенчмаркам, занимая 6-е место в общем рейтинге при сохранении превосходной эффективности. Поддерживает контекст 128K токенов и выпущена под лицензией MIT с открытым исходным кодом, разрешающей коммерческое использование.

Основные характеристики

Параметры

106.0B

Контекст

Дата выпуска

28 июля 2025 г.

Средний балл

60.8%

API документация Исследование Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

28 июля 2025 г.

Последнее обновление

15 сентября 2025 г.

Сегодня

26 октября 2025 г.

Технические характеристики

Параметры

106.0B

Токены обучения

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-bench-Verified

OpenHands v0.34.0 • Self-reported

57.6%

Рассуждения

Логические рассуждения и анализ

GPQA

Avg@8 • Self-reported

75.0%

Другие тесты

Специализированные бенчмарки

MMLU-Pro

standard • Self-reported

81.4%

AIME24

Avg@32 • Self-reported

89.4%

MATH-500

standard • Self-reported

98.1%

SciCode

standard • Self-reported

37.3%

LiveCodeBench

2407-2501 • Self-reported

70.7%

TAU-bench-Retail

optimized user simulator • Self-reported

77.9%

BFCL-v3

Full • Self-reported

76.4%

TAU-bench-Airline

optimized user simulator • Self-reported

60.8%

BrowseComp

standard • Self-reported

21.3%

HLE

text-based questions only • Self-reported

10.6%

AA-Index

Estimated • Self-reported

64.8%

Terminal-Bench

Terminus framework • Self-reported

30.0%

Лицензия и метаданные

Лицензия

mit

Дата анонса

28 июля 2025 г.

Последнее обновление

15 сентября 2025 г.