GLM-4.5

Zhipu AI

GLM-4.5 — это базовая модель для агентного ИИ, рассуждений и программирования (ARC), разработанная для интеллектуальных агентов. Модель имеет 355 миллиардов параметров с 32 миллиардами активных параметров благодаря архитектуре MoE. Обучена на 23T токенах через многоэтапное обучение. Это гибридная модель рассуждений, предоставляющая два режима: режим мышления для сложных рассуждений и использования инструментов, и обычный режим для немедленных ответов. Модель объединяет возможности агентного ИИ, рассуждений и программирования с поддержкой контекста 128K токенов. Достигает исключительной производительности с оценкой 63.2 по 12 отраслевым бенчмаркам, занимая 3-е место среди всех проприетарных и открытых моделей. Выпущена под лицензией MIT с открытым исходным кодом, разрешающей коммерческое использование и вторичную разработку.

Основные характеристики

Параметры

355.0B

Контекст

131.1K

Дата выпуска

28 июля 2025 г.

Средний балл

64.0%

API документация Исследование Репозиторий Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

28 июля 2025 г.

Последнее обновление

15 сентября 2025 г.

Сегодня

26 октября 2025 г.

Технические характеристики

Параметры

355.0B

Токены обучения

23.0T токенов

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.60

Выход (за 1М токенов)

$2.20

Макс. входящих токенов

131.1K

Макс. исходящих токенов

98.3K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-bench-Verified

OpenHands v0.34.0 • Self-reported

64.2%

Рассуждения

Логические рассуждения и анализ

GPQA

Avg@8 • Self-reported

79.1%

Другие тесты

Специализированные бенчмарки

MMLU-Pro

standard • Self-reported

84.6%

AIME24

Avg@32 • Self-reported

91.0%

MATH-500

standard • Self-reported

98.2%

SciCode

standard • Self-reported

41.7%

LiveCodeBench

2407-2501 • Self-reported

72.9%

TAU-bench-Retail

optimized user simulator • Self-reported

79.7%

BFCL-v3

Full • Self-reported

77.8%

TAU-bench-Airline

optimized user simulator • Self-reported

60.4%

BrowseComp

standard • Self-reported

26.4%

HLE

text-based questions only • Self-reported

14.4%

AA-Index

Estimated • Self-reported

67.7%

Terminal-Bench

Terminus framework • Self-reported

37.5%

Лицензия и метаданные

Лицензия

mit

Дата анонса

28 июля 2025 г.

Последнее обновление

15 сентября 2025 г.

Похожие модели

Все модели

GLM-4.6

Zhipu AI

MM357.0B

Лучший скор:0.8 (GPQA)

Релиз:сент. 2025 г.

Цена:$0.60/1M токенов

Kimi K2-Instruct-0905

Moonshot AI

1.0T

Лучший скор:0.9 (MMLU)

Релиз:сент. 2025 г.

Цена:$0.60/1M токенов

Mistral Large 2

Mistral AI

123.0B

Лучший скор:0.9 (HumanEval)

Релиз:июль 2024 г.

Цена:$2.00/1M токенов

Kimi K2 0905

Moonshot AI

1.0T

Лучший скор:0.9 (HumanEval)

Релиз:сент. 2025 г.

Цена:$0.60/1M токенов

Kimi K2 Instruct

Moonshot AI

1.0T

Лучший скор:0.9 (HumanEval)

Релиз:янв. 2025 г.

Цена:$0.57/1M токенов

Command R+

Cohere

104.0B

Лучший скор:0.8 (MMLU)

Релиз:авг. 2024 г.

Цена:$0.25/1M токенов

Llama 3.1 405B Instruct

DeepSeek-V3.2-Exp

DeepSeek

685.0B

Лучший скор:0.8 (GPQA)

Релиз:сент. 2025 г.

Цена:$0.27/1M токенов

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.