Модель за $3 набрала 94,6% от Claude Opus 4.6 в кодинге
Z.AI выпустила GLM-5.1 с результатом 45,3 в тесте кодинга — на 28% выше предшественника. Разбираем, что изменилось и стоит ли переходить.

27 марта Z.AI тихо выкатила GLM-5.1 для пользователей тарифа Coding Plan. Без громких анонсов, без пресс-конференций — просто новая модель в API. А потом пошли бенчмарки: 45,3 балла в тесте кодинга через Claude Code в качестве харнесса. Для сравнения — Claude Opus 4.6 набирает 47,9. Разрыв сократился до нескольких процентов.
Откуда такой скачок
GLM-5, вышедшая несколькими неделями ранее, набирала 35,4 балла в том же тесте. GLM-5.1 прибавила сразу 28% — скачок, который в индустрии встречается нечасто между минорными версиями. Z.AI не раскрыла подробностей архитектурных изменений, но сообщество на Reddit быстро отметило улучшения в длинных агентных задачах и работе с инструментами.
При этом у модели есть характерная особенность: она заточена под код. Настолько, что при обычных текстовых вопросах может выдавать ответы с «кодовым уклоном». На форумах NVIDIA разработчики уже просят заменить GLM-5 на GLM-5.1 в NIM, но предупреждают о лёгких регрессиях в общих задачах и математике.
Цифры в контексте
| Модель | Кодинг (Claude Code harness) | Стоимость |
|---|---|---|
| Claude Opus 4.6 | 47,9 | ~$15/1M токенов |
| GLM-5.1 | 45,3 | ~$3/1M токенов |
| GLM-5 | 35,4 | ~$3/1M токенов |
Соотношение цена-качество впечатляет. За пятую часть стоимости Opus пользователь получает модель, которая закрывает почти 95% его результата в кодинге. Разумеется, Claude лидирует по совокупности задач — рассуждения, мультимодальность, работа с длинным контекстом. Но для чисто кодовых задач GLM-5.1 становится серьёзной альтернативой.
Кому это важно
Для разработчиков, которые используют AI-ассистенты для написания кода и не хотят платить за премиальные модели, GLM-5.1 — интересный вариант. Модель доступна через Z.AI на тарифе Coding Plan. Сообщество LocalLLaMA ждёт выхода открытых весов, но пока конкретных сроков нет.
Отдельный вопрос — доверие к бенчмаркам. Комментаторы на YouTube отмечают, что компании, дающие ранний доступ блогерам, могут оптимизировать модели под конкретные тесты. Независимых подтверждений результата GLM-5.1 пока немного, но первые отзывы от разработчиков в целом позитивные.
Что дальше
Z.AI продолжает агрессивно сокращать разрыв с лидерами. Если тенденция сохранится, к следующему крупному релизу GLM может вплотную подобраться к Opus в кодинге — и при этом остаться в разы дешевле. Вопрос в том, смогут ли они подтянуть качество в остальных задачах, не жертвуя тем, в чём уже сильны.

