Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic
Kimi K2.7 Code в GitHub Copilot, GLM-5.2 на трафике OpenRouter, Coinbase режет расходы вдвое. Разбираем, как открытые модели догнали закрытые.

"У нас теперь есть китайская open-weight модель, которая так же хороша, как доступные сейчас модели от OpenAI и Anthropic."
Это сказал не энтузиаст open-source, а Дэвид Сакс — бывший «ИИ-царь» администрации Трампа. Речь шла о GLM-5.2 от Z.ai, но фраза точно описывает главный сдвиг лета 2026 года: разговоры о том, «догонят ли» открытые модели закрытые, кажется, закончились. Догнали.
Что случилось
1 июля 2026 года модель Kimi K2.7 Code от пекинской Moonshot AI стала общедоступной в GitHub Copilot — первая open-weight модель от китайской лаборатории в самом популярном ИИ-помощнике для программистов. От публикации весов на Hugging Face до появления в Copilot прошло всего 19 дней. Теперь Copilot предлагает модели пяти независимых лабораторий: OpenAI, Anthropic, Google, Microsoft и Moonshot AI.
Днём раньше Reuters написал, что GLM-5.2 «наконец закрывает разрыв» в глазах западных пользователей, и назвал это «мини-DeepSeek-моментом». По трафику на OpenRouter GLM-5.2 уже обошёл модели Anthropic. Два китайских релиза с разницей в один день сделали то, что ещё год назад казалось делом отдалённого будущего.
Что за модели
Kimi K2.7 Code вышла 12 июня под модифицированной лицензией MIT. Это MoE-архитектура на триллион параметров с 32 миллиардами активных на токен, контекстом в 256 тысяч токенов и нативным вводом изображений. Главное её обещание разработчикам — экономия: примерно на 30% меньше reasoning-токенов, чем у предыдущей версии, что напрямую снижает счёт в агентных сценариях.
Ключевые характеристики Kimi K2.7 Code:
- Архитектура: MoE, 1 трлн параметров, 32 млрд активных, 384 эксперта
- Контекст: 256 000 токенов, нативная работа с изображениями
- Цена API: $0.95 за 1 млн входных токенов, $4.00 за 1 млн выходных
- Лицензия: Modified MIT, коммерческое использование разрешено
- Квантизация INT4 — около 240 ГБ вместо ~600 ГБ
Второй игрок, GLM-5.2 от Z.ai, вышел 13 июня под чистой MIT-лицензией: около 744 млрд параметров, 40 млрд активных, цена $1.40 / $4.40 за миллион токенов. Для сравнения, Claude Opus 4.8 стоит $5 / $25 — то есть открытая модель дешевле по входу в 3–4 раза, а по выходу почти в шесть.
Насколько близко по качеству
Здесь нужна оговорка: большинство бенчмарков Kimi — заявленные самой Moonshot и на публичных лидербордах независимо не воспроизведённые. Сравнения к тому же сделаны в разных режимах вычислений, так что они «в лучшем случае направленные». С этой поправкой цифры выглядят так:
| Бенчмарк | Kimi K2.7 Code | Claude Opus 4 | GPT-4o |
|---|---|---|---|
| Tool-use (function calling) | 68.4 | 65.1 | 61.7 |
| HumanEval | 86.4 | 84.3 | 82.1 |
| MBPP | 83.7 | 81.2 | 79.8 |
| SWE-Bench Verified | 44.1 | 40.2 | 38.9 |
У GLM-5.2 картина по независимым замерам смешаннее: на SWE-bench Pro она показывает 62.1% против 58.6% у GPT-5.5, но отстаёт от Claude Opus 4.8 и Gemini 3.1 Pro на 5–10 пунктов на сложных тестах вроде Humanity's Last Exam и заметно уступает на многошаговом использовании инструментов. И отдельная реальность поверх всех лидербордов: аудиторская фирма Kili Technology зафиксировала в среднем 37% разрыв между лабораторными бенчмарками и продакшн-производительностью агентных систем.
Иными словами, открытые модели не столько «победили», сколько подошли достаточно близко, чтобы для многих задач разница перестала оправдывать разницу в цене.
Почему это уже влияет на бизнес
Самый громкий пример — Coinbase. Компания урезала внутренние расходы на ИИ почти вдвое, сделав Kimi K2.7 Code и GLM-5.2 моделями по умолчанию через собственный внутренний шлюз.
"Вместо того чтобы снижать лимиты и множить алерты, мы переходим на более дешёвые дефолты. Люди не должны выбирать модели — ИИ может автоматизировать эту задачу." — Брайан Армстронг, CEO Coinbase
И это не единичный случай. Стартап Lindy полностью перешёл с Claude на DeepSeek V4, сэкономив миллионы. Microsoft оценивает дообученную DeepSeek V4 для Copilot. Для компаний, у которых потребление токенов растёт по экспоненте, разница в цене в несколько раз — это уже не строчка в бюджете, а стратегическое решение.
Обратная сторона
Дешевизна и открытость идут в комплекте с рисками, которые многих на Западе остановят. Moonshot AI и Z.ai — пекинские компании, подпадающие под китайский закон о нацбезопасности; Z.ai с января 2025 года находится в Entity List Минторга США. GitHub прямо предупреждает, что K2.7 Code «может быть хуже выровнена» и нести повышенный риск вредного контента.
"В ЕС и США некоторые клиенты, партнёры и регулируемые отрасли могут просто не принять китайские модели в свой стек — независимо от производительности или цены." — Вэй Сунь, Counterpoint Research
Так что расклад двойственный. По данным RAND, глобальная доля китайских LLM выросла с 3% до 13% всего за два месяца после запуска DeepSeek R1 — сильнее всего в развивающихся странах. Но в зарегулированных отраслях США и Европы вопрос суверенитета данных перевесит любые бенчмарки.
Что дальше
Ирония в том, что паузе открытых моделей помогли сами США: временные ограничения на модели Anthropic и отложенный публичный запуск GPT-5.6 дали китайским лабораториям фору именно в тот момент, когда они были готовы ею воспользоваться. Как заметил один аналитик, экономия токенов от одного релиза — это «фича, которую стирает следующая модель». Но сам факт, что выбор между «закрытой и дорогой» и «открытой и дешёвой» стал реальным выбором, а не компромиссом ради экономии, — это и есть закрывшийся разрыв.


