GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
kimiopen-sourcemoonshotкитайсравнение

Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic

Kimi K2.7 Code в GitHub Copilot, GLM-5.2 на трафике OpenRouter, Coinbase режет расходы вдвое. Разбираем, как открытые модели догнали закрытые.

Влад МакаровВлад Макаровпроверил и опубликовал
8 мин чтения
Разрыв закрылся: открытые модели догоняют OpenAI и Anthropic

"У нас теперь есть китайская open-weight модель, которая так же хороша, как доступные сейчас модели от OpenAI и Anthropic."

Это сказал не энтузиаст open-source, а Дэвид Сакс — бывший «ИИ-царь» администрации Трампа. Речь шла о GLM-5.2 от Z.ai, но фраза точно описывает главный сдвиг лета 2026 года: разговоры о том, «догонят ли» открытые модели закрытые, кажется, закончились. Догнали.

Что случилось

1 июля 2026 года модель Kimi K2.7 Code от пекинской Moonshot AI стала общедоступной в GitHub Copilot — первая open-weight модель от китайской лаборатории в самом популярном ИИ-помощнике для программистов. От публикации весов на Hugging Face до появления в Copilot прошло всего 19 дней. Теперь Copilot предлагает модели пяти независимых лабораторий: OpenAI, Anthropic, Google, Microsoft и Moonshot AI.

Днём раньше Reuters написал, что GLM-5.2 «наконец закрывает разрыв» в глазах западных пользователей, и назвал это «мини-DeepSeek-моментом». По трафику на OpenRouter GLM-5.2 уже обошёл модели Anthropic. Два китайских релиза с разницей в один день сделали то, что ещё год назад казалось делом отдалённого будущего.

Что за модели

Kimi K2.7 Code вышла 12 июня под модифицированной лицензией MIT. Это MoE-архитектура на триллион параметров с 32 миллиардами активных на токен, контекстом в 256 тысяч токенов и нативным вводом изображений. Главное её обещание разработчикам — экономия: примерно на 30% меньше reasoning-токенов, чем у предыдущей версии, что напрямую снижает счёт в агентных сценариях.

Ключевые характеристики Kimi K2.7 Code:

  • Архитектура: MoE, 1 трлн параметров, 32 млрд активных, 384 эксперта
  • Контекст: 256 000 токенов, нативная работа с изображениями
  • Цена API: $0.95 за 1 млн входных токенов, $4.00 за 1 млн выходных
  • Лицензия: Modified MIT, коммерческое использование разрешено
  • Квантизация INT4 — около 240 ГБ вместо ~600 ГБ

Второй игрок, GLM-5.2 от Z.ai, вышел 13 июня под чистой MIT-лицензией: около 744 млрд параметров, 40 млрд активных, цена $1.40 / $4.40 за миллион токенов. Для сравнения, Claude Opus 4.8 стоит $5 / $25 — то есть открытая модель дешевле по входу в 3–4 раза, а по выходу почти в шесть.

Насколько близко по качеству

Здесь нужна оговорка: большинство бенчмарков Kimi — заявленные самой Moonshot и на публичных лидербордах независимо не воспроизведённые. Сравнения к тому же сделаны в разных режимах вычислений, так что они «в лучшем случае направленные». С этой поправкой цифры выглядят так:

БенчмаркKimi K2.7 CodeClaude Opus 4GPT-4o
Tool-use (function calling)68.465.161.7
HumanEval86.484.382.1
MBPP83.781.279.8
SWE-Bench Verified44.140.238.9

У GLM-5.2 картина по независимым замерам смешаннее: на SWE-bench Pro она показывает 62.1% против 58.6% у GPT-5.5, но отстаёт от Claude Opus 4.8 и Gemini 3.1 Pro на 5–10 пунктов на сложных тестах вроде Humanity's Last Exam и заметно уступает на многошаговом использовании инструментов. И отдельная реальность поверх всех лидербордов: аудиторская фирма Kili Technology зафиксировала в среднем 37% разрыв между лабораторными бенчмарками и продакшн-производительностью агентных систем.

Иными словами, открытые модели не столько «победили», сколько подошли достаточно близко, чтобы для многих задач разница перестала оправдывать разницу в цене.

Почему это уже влияет на бизнес

Самый громкий пример — Coinbase. Компания урезала внутренние расходы на ИИ почти вдвое, сделав Kimi K2.7 Code и GLM-5.2 моделями по умолчанию через собственный внутренний шлюз.

"Вместо того чтобы снижать лимиты и множить алерты, мы переходим на более дешёвые дефолты. Люди не должны выбирать модели — ИИ может автоматизировать эту задачу." — Брайан Армстронг, CEO Coinbase

И это не единичный случай. Стартап Lindy полностью перешёл с Claude на DeepSeek V4, сэкономив миллионы. Microsoft оценивает дообученную DeepSeek V4 для Copilot. Для компаний, у которых потребление токенов растёт по экспоненте, разница в цене в несколько раз — это уже не строчка в бюджете, а стратегическое решение.

Обратная сторона

Дешевизна и открытость идут в комплекте с рисками, которые многих на Западе остановят. Moonshot AI и Z.ai — пекинские компании, подпадающие под китайский закон о нацбезопасности; Z.ai с января 2025 года находится в Entity List Минторга США. GitHub прямо предупреждает, что K2.7 Code «может быть хуже выровнена» и нести повышенный риск вредного контента.

"В ЕС и США некоторые клиенты, партнёры и регулируемые отрасли могут просто не принять китайские модели в свой стек — независимо от производительности или цены." — Вэй Сунь, Counterpoint Research

Так что расклад двойственный. По данным RAND, глобальная доля китайских LLM выросла с 3% до 13% всего за два месяца после запуска DeepSeek R1 — сильнее всего в развивающихся странах. Но в зарегулированных отраслях США и Европы вопрос суверенитета данных перевесит любые бенчмарки.

Что дальше

Ирония в том, что паузе открытых моделей помогли сами США: временные ограничения на модели Anthropic и отложенный публичный запуск GPT-5.6 дали китайским лабораториям фору именно в тот момент, когда они были готовы ею воспользоваться. Как заметил один аналитик, экономия токенов от одного релиза — это «фича, которую стирает следующая модель». Но сам факт, что выбор между «закрытой и дорогой» и «открытой и дешёвой» стал реальным выбором, а не компромиссом ради экономии, — это и есть закрывшийся разрыв.

Похожие новости

Листайте вниз

для загрузки следующей статьи