GLM-4.7-Flash

Name: GLM-4.7-Flash
Author: Zhipu AI

Zhipu AI

GLM-4.7-Flash — быстрый и экономичный вариант GLM-4.7, оптимизированный для высокой скорости вывода и низкой задержки. Сохраняет возможности GLM-4.7 в области программирования, включая размышление перед действием, сохранение рассуждений между ходами и управление режимом мышления на уровне запроса. Построен на архитектуре MoE с 30B параметров. Идеален для приложений, требующих быстрых ответов при сохранении высокой производительности в кодинге, агентных workflow и общих задачах рассуждения.

Основные характеристики

Параметры

30.0B

Контекст

128.0K

Дата выпуска

18 января 2026 г.

Средний балл

60.5%

API документация Веса модели Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс

18 января 2026 г.

Последнее обновление

22 января 2026 г.

Сегодня

7 мая 2026 г.

Технические характеристики

Параметры

30.0B

Токены обучения

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$0.07

Выход (за 1М токенов)

$0.40

Макс. входящих токенов

128.0K

Макс. исходящих токенов

16.4K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-Bench Verified

• Self-reported

59.0%

Рассуждения

Логические рассуждения и анализ

GPQA

Подмножество Diamond • Self-reported

75.0%

Другие тесты

Специализированные бенчмарки

AIME 2025

• Self-reported

92.0%

TAU-Bench

• Self-reported

80.0%

BrowseComp

• Self-reported

43.0%

HLE

• Self-reported

14.0%

Лицензия и метаданные

Лицензия

mit

Дата анонса

18 января 2026 г.

Последнее обновление

22 января 2026 г.

Статьи о GLM-4.7-Flash

Фикс GLM-4.7 Flash в llama.cpp: перескачайте модель

Критический багфикс устранил зацикливание и плохие ответы. GGUF-файлы переконвертированы, нужно скачать заново.

23 января 2026 г.

2 мин

GLM-4.7-Flash: китайский ответ на дорогие модели для кодинга

Z.ai выпустила GLM-4.7-Flash — open-source модель на 30B параметров с архитектурой MLA. Разбираем характеристики, бенчмарки, цены и сравнение с Claude.

20 января 2026 г.

6 мин

Похожие модели

Все модели

GLM-4.5-Air

Zhipu AI

106.0B

Лучший скор:0.8 (TAU)

Релиз:июль 2025 г.

GLM-4.5

Zhipu AI

355.0B

Лучший скор:0.8 (GPQA)

Релиз:июль 2025 г.

Цена:$0.60/1M токенов

LongCat-Flash-Lite

Meituan

68.5B

Лучший скор:0.9 (MMLU)

Релиз:февр. 2026 г.

Hermes 3 70B

Nous Research

70.0B

Лучший скор:0.8 (MMLU)

Релиз:авг. 2024 г.

Nemotron 3 Nano (30B A3B)

NVIDIA

32.0B

Лучший скор:0.8 (GPQA)

Релиз:дек. 2025 г.

Цена:$0.06/1M токенов

Llama 3.1 Nemotron 70B Instruct

NVIDIA

70.0B

Лучший скор:0.8 (MMLU)

Релиз:окт. 2024 г.

ERNIE 4.5

Baidu

21.0B

Лучший скор:0.7 (GPQA)

Релиз:июнь 2025 г.

Phi 4 Reasoning Plus

Microsoft

14.0B

Лучший скор:0.9 (HumanEval)

Релиз:апр. 2025 г.

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

GLM-4.7-Flash

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Программирование

Рассуждения

Другие тесты

Лицензия и метаданные

Статьи о GLM-4.7-Flash

Фикс GLM-4.7 Flash в llama.cpp: перескачайте модель

GLM-4.7-Flash: китайский ответ на дорогие модели для кодинга

Похожие модели

GLM-4.5-Air

GLM-4.5

LongCat-Flash-Lite

Hermes 3 70B

Nemotron 3 Nano (30B A3B)

Llama 3.1 Nemotron 70B Instruct

ERNIE 4.5

Phi 4 Reasoning Plus