Zhipu AI logo

GLM-4.5

Zhipu AI

GLM-4.5 — это базовая модель для агентного ИИ, рассуждений и программирования (ARC), разработанная для интеллектуальных агентов. Модель имеет 355 миллиардов параметров с 32 миллиардами активных параметров благодаря архитектуре MoE. Обучена на 23T токенах через многоэтапное обучение. Это гибридная модель рассуждений, предоставляющая два режима: режим мышления для сложных рассуждений и использования инструментов, и обычный режим для немедленных ответов. Модель объединяет возможности агентного ИИ, рассуждений и программирования с поддержкой контекста 128K токенов. Достигает исключительной производительности с оценкой 63.2 по 12 отраслевым бенчмаркам, занимая 3-е место среди всех проприетарных и открытых моделей. Выпущена под лицензией MIT с открытым исходным кодом, разрешающей коммерческое использование и вторичную разработку.

Основные характеристики

Параметры
355.0B
Контекст
131.1K
Дата выпуска
28 июля 2025 г.
Средний балл
64.0%

Временная шкала

Ключевые даты в истории модели
Анонс
28 июля 2025 г.
Последнее обновление
15 сентября 2025 г.
Сегодня
26 октября 2025 г.

Технические характеристики

Параметры
355.0B
Токены обучения
23.0T токенов
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$0.60
Выход (за 1М токенов)
$2.20
Макс. входящих токенов
131.1K
Макс. исходящих токенов
98.3K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования
SWE-bench-Verified
OpenHands v0.34.0Self-reported
64.2%

Рассуждения

Логические рассуждения и анализ
GPQA
Avg@8Self-reported
79.1%

Другие тесты

Специализированные бенчмарки
MMLU-Pro
standardSelf-reported
84.6%
AIME24
Avg@32Self-reported
91.0%
MATH-500
standardSelf-reported
98.2%
SciCode
standardSelf-reported
41.7%
LiveCodeBench
2407-2501Self-reported
72.9%
TAU-bench-Retail
optimized user simulatorSelf-reported
79.7%
BFCL-v3
FullSelf-reported
77.8%
TAU-bench-Airline
optimized user simulatorSelf-reported
60.4%
BrowseComp
standardSelf-reported
26.4%
HLE
text-based questions onlySelf-reported
14.4%
AA-Index
EstimatedSelf-reported
67.7%
Terminal-Bench
Terminus frameworkSelf-reported
37.5%

Лицензия и метаданные

Лицензия
mit
Дата анонса
28 июля 2025 г.
Последнее обновление
15 сентября 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.