GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
z-aiglmкодингбенчмаркирелиз

Модель за $3 набрала 94,6% от Claude Opus 4.6 в кодинге

Z.AI выпустила GLM-5.1 с результатом 45,3 в тесте кодинга — на 28% выше предшественника. Разбираем, что изменилось и стоит ли переходить.

Влад МакаровВлад Макаровпроверил и опубликовал
5 мин чтения
Модель за $3 набрала 94,6% от Claude Opus 4.6 в кодинге

27 марта Z.AI тихо выкатила GLM-5.1 для пользователей тарифа Coding Plan. Без громких анонсов, без пресс-конференций — просто новая модель в API. А потом пошли бенчмарки: 45,3 балла в тесте кодинга через Claude Code в качестве харнесса. Для сравнения — Claude Opus 4.6 набирает 47,9. Разрыв сократился до нескольких процентов.

Откуда такой скачок

GLM-5, вышедшая несколькими неделями ранее, набирала 35,4 балла в том же тесте. GLM-5.1 прибавила сразу 28% — скачок, который в индустрии встречается нечасто между минорными версиями. Z.AI не раскрыла подробностей архитектурных изменений, но сообщество на Reddit быстро отметило улучшения в длинных агентных задачах и работе с инструментами.

При этом у модели есть характерная особенность: она заточена под код. Настолько, что при обычных текстовых вопросах может выдавать ответы с «кодовым уклоном». На форумах NVIDIA разработчики уже просят заменить GLM-5 на GLM-5.1 в NIM, но предупреждают о лёгких регрессиях в общих задачах и математике.

Цифры в контексте

МодельКодинг (Claude Code harness)Стоимость
Claude Opus 4.647,9~$15/1M токенов
GLM-5.145,3~$3/1M токенов
GLM-535,4~$3/1M токенов

Соотношение цена-качество впечатляет. За пятую часть стоимости Opus пользователь получает модель, которая закрывает почти 95% его результата в кодинге. Разумеется, Claude лидирует по совокупности задач — рассуждения, мультимодальность, работа с длинным контекстом. Но для чисто кодовых задач GLM-5.1 становится серьёзной альтернативой.

Кому это важно

Для разработчиков, которые используют AI-ассистенты для написания кода и не хотят платить за премиальные модели, GLM-5.1 — интересный вариант. Модель доступна через Z.AI на тарифе Coding Plan. Сообщество LocalLLaMA ждёт выхода открытых весов, но пока конкретных сроков нет.

Отдельный вопрос — доверие к бенчмаркам. Комментаторы на YouTube отмечают, что компании, дающие ранний доступ блогерам, могут оптимизировать модели под конкретные тесты. Независимых подтверждений результата GLM-5.1 пока немного, но первые отзывы от разработчиков в целом позитивные.

Что дальше

Z.AI продолжает агрессивно сокращать разрыв с лидерами. Если тенденция сохранится, к следующему крупному релизу GLM может вплотную подобраться к Opus в кодинге — и при этом остаться в разы дешевле. Вопрос в том, смогут ли они подтянуть качество в остальных задачах, не жертвуя тем, в чём уже сильны.

Похожие новости

Листайте вниз

для загрузки следующей статьи