GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
minimaxm2.7релизself-evolvingкитайский AI

MiniMax M2.7: модель, которая сама себя обучала

MiniMax выпустила M2.7 — проприетарную фронтирную модель, которая выполняла 30–50% собственного обучения. Разбираем архитектуру и бенчмарки.

Влад МакаровВлад Макаровпроверил и опубликовал
7 мин чтения
MiniMax M2.7: модель, которая сама себя обучала

Месяц назад MiniMax удивила индустрию, выпустив open-source модель M2.5, которая по кодингу догнала Claude Sonnet. Теперь шанхайский стартап пошёл ещё дальше — и одновременно сменил стратегию. M2.7 стала проприетарной, но главное не это: модель участвовала в собственном обучении, взяв на себя от 30 до 50 процентов рабочего процесса reinforcement learning.

Модель, которая строит сама себя

Звучит как маркетинг, но за этим стоит конкретная инженерная работа. Ранние версии M2.7 использовались для создания исследовательского агента, способного управлять пайплайнами данных, средами обучения и инфраструктурой оценки. Модель автономно читала логи, дебажила и анализировала метрики, проходя через итеративные циклы по 100+ раундов.

«Мы целенаправленно обучали модель лучше планировать и уточнять требования с пользователем», — объяснил Скайлер Мяо, руководитель инженерного отдела MiniMax. «Следующий шаг — более сложный симулятор пользователя, чтобы продвинуть это ещё дальше».

На MLE Bench Lite — серии соревнований по машинному обучению для проверки исследовательских способностей — M2.7 получила медали в 66,6% случаев. Это на уровне Gemini 3.1 и приближается к Claude Opus 4.6.

Бенчмарки: где M2.7 обгоняет конкурентов

Прогресс относительно M2.5 заметен прежде всего в инженерных задачах и работе с документами.

БенчмаркM2.7M2.5GPT-5.3-CodexClaude Opus 4.6
SWE-Pro56,22%56,2%
Terminal Bench 257,0%77,3%69,2%
GDPval-AA (Elo)1495
MLE Bench Lite66,6%71,4%
Artificial Analysis Index5042

Отдельного внимания заслуживает галлюцинация. По AA-Omniscience Index модель набрала +1 — против -40 у M2.5. Частота галлюцинаций составила 34%, тогда как у Claude Sonnet 4.6 — 46%, а у Gemini 3.1 Pro Preview — 50%. Для модели по цене $1,50 за миллион токенов это серьёзное достижение.

Впрочем, не все бенчмарки показывают рост. На BridgeBench, тестирующем «вайб-кодинг» — превращение естественного языка в рабочий код — M2.7 оказалась на 19-м месте против 12-го у M2.5. Это намекает на то, что оптимизация шла в сторону системного инжиниринга, а не свободного генерирования кода.

Цена: в 20 раз дешевле Opus

Главное конкурентное преимущество M2.7 — соотношение цены и качества. При $0,30 за миллион входных токенов и $1,20 за выходные, это одна из самых дешёвых фронтирных моделей в мире. Дешевле только Grok 4.1 Fast от xAI.

МодельInput/1MOutput/1MИтого
Grok 4.1 Fast$0,20$0,50$0,70
MiniMax M2.7$0,30$1,20$1,50
Gemini 3 Flash$0,50$3,00$3,50
Claude Haiku 4.5$1,00$5,00$6,00
GPT-5.2$1,75$14,00$15,75
Claude Opus 4.6$5,00$25,00$30,00

По данным VentureBeat, стоимость работы M2.7 на стандартном наборе задач составила $176 — против $547 для GLM-5 и $371 для Kimi K2.5. При этом M2.7 использует на 20% меньше выходных токенов, чем GLM-5 при сопоставимом уровне интеллекта.

Проприетарный разворот

M2.5 была open-source и позволяла запускать модель локально. M2.7 — проприетарная, доступная только через API и платформы MiniMax. Это второй случай за последние месяцы, когда китайский AI-стартап уходит от открытой стратегии: ранее аналогичный шаг сделала Z.ai с GLM-5 Turbo.

Ходят слухи, что и команда Qwen в Alibaba движется в сторону проприетарности — на фоне ухода ключевых исследователей. Если тренд продолжится, это может серьёзно изменить расклад для разработчиков, привыкших к бесплатным китайским моделям на OpenRouter.

Тем не менее MiniMax поддерживает интеграцию с 11+ инструментами разработки: Claude Code, Cursor, Trae, Zed, Kilo Code, Cline, Roo Code и другими. Модель работает с Model Context Protocol и совместима с Anthropic SDK — достаточно сменить базовый URL.

Что это значит для разработчиков

M2.7 занимает интересную нишу: это не самая умная модель в мире (8-е место по Artificial Analysis), но одна из самых экономичных на уровне фронтира. Для задач, где важна стоимость — массовая обработка документов, агентные пайплайны, мониторинг инфраструктуры — она может оказаться оптимальным выбором.

Самоэволюция пока выглядит как маркетинговый козырь, но за ней стоит реальный результат: +8 пунктов по Intelligence Index за месяц. Если MiniMax продолжит этот цикл, M2.8 или M3 может стать по-настоящему опасным конкурентом. Особенно если вернётся к open-source.

Похожие новости

Листайте вниз

для загрузки следующей статьи