Kimi K2.5: китайская open-source модель обошла GPT-5.2 и Claude Opus в кодинге

Moonshot AI выпустила мультимодальную модель с 1T параметрами и 32B активными. Kimi K2.5 лидирует на SWE-Bench Multilingual и VideoMMMU.

Влад Макаровпроверил и опубликовал

28 января 2026 г.

5 мин чтения

Kimi K2.5: китайская open-source модель обошла GPT-5.2 и Claude Opus в кодинге

Moonshot AI выпустила Kimi K2.5 — мультимодальную модель с открытым кодом, которая обходит GPT-5.2 и Claude Opus 4.5 на ключевых бенчмарках. Компания также представила Kimi Code — агент для программирования, конкурирующий с Claude Code от Anthropic.

Что нового

Kimi K2.5 — нативно мультимодальная модель, понимающая текст, изображения и видео. Обучалась на 15 триллионах смешанных визуальных и текстовых токенов.

Главная фишка — работа с агентными «роями» (agent swarms), когда несколько агентов координируют свои действия для решения сложных задач. Для программистов это означает возможность загружать скриншоты или видео интерфейса и просить модель воспроизвести его в коде.

Технические характеристики:

Архитектура: MoE (Mixture of Experts)
Общее число параметров: ~1 триллион
Активных параметров: 32 миллиарда
Обучающие данные: 15 триллионов токенов
Модальности: текст, изображения, видео
Лицензия: open-source

Производительность

Бенчмарк	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
SWE-Bench Verified	58.2%	54.1%	56.7%	52.3%
SWE-Bench Multilingual	61.4%	57.8%	59.2%	55.6%
VideoMMMU	72.1%	68.4%	69.8%	71.5%

На бенчмарке SWE-Bench Verified, который проверяет способность модели решать реальные задачи из GitHub-репозиториев, Kimi K2.5 опережает Gemini 3 Pro. На мультиязычной версии бенчмарка модель лидирует среди всех конкурентов.

В понимании видео (VideoMMMU) Kimi K2.5 превосходит GPT-5.2 и Claude Opus 4.5, уступая только Gemini 3 Pro на десятые доли процента.

Kimi Code — агент для разработчиков

Вместе с моделью компания представила Kimi Code — инструмент командной строки для программирования с AI. Работает через терминал и интегрируется с VSCode, Cursor и Zed.

В отличие от многих конкурентов, Kimi Code принимает на вход не только текст, но и изображения с видео. Можно показать агенту скриншот интерфейса и попросить сверстать аналогичный.

Рынок кодинг-ассистентов растёт взрывными темпами. В ноябре 2025 Anthropic объявила, что Claude Code достиг $1 млрд годовой выручки (ARR). По данным Wired, к концу года инструмент добавил ещё $100 млн.

О компании

Moonshot AI основал Ян Чжилинь, бывший исследователь Google и Meta AI. Компанию поддерживают Alibaba и HongShan (бывший Sequoia China).

Стартап привлёк $1 млрд в раунде Series B при оценке $2.5 млрд. По данным Bloomberg, в декабре 2025 года Moonshot получила ещё $500 млн при оценке $4.3 млрд и уже ищет новый раунд на $5 млрд.

Конкуренция с DeepSeek

Релиз происходит на фоне ожидаемого выхода новой флагманской модели DeepSeek с сильными способностями к кодингу. По данным The Information, DeepSeek планирует релиз в феврале.

Китайские AI-компании всё агрессивнее конкурируют за рынок инструментов для разработчиков, где американские игроки пока доминируют.

Как попробовать

Модель доступна:

Веса на Hugging Face
API через платформу Moonshot
Kimi Code для локальной работы

Для разработчиков, которые ищут open-source альтернативу закрытым моделям с сильным кодингом и мультимодальностью, Kimi K2.5 — серьёзный кандидат для тестирования.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Kimi K2.5: китайская open-source модель обошла GPT-5.2 и Claude Opus в кодинге

Что нового

Производительность

Kimi Code — агент для разработчиков

О компании

Конкуренция с DeepSeek

Как попробовать

Похожие новости

GLM-4.7-Flash: китайский ответ на дорогие модели для кодинга

Qwen3-Coder-Next: 70% SWE-bench при 3B активных параметрах

DeepSeek V4 выходит 17 февраля: что известно о новом coding-гиганте