Kimi K2.5: китайская open-source модель обошла GPT-5.2 и Claude Opus в кодинге
Moonshot AI выпустила мультимодальную модель с 1T параметрами и 32B активными. Kimi K2.5 лидирует на SWE-Bench Multilingual и VideoMMMU.

Moonshot AI выпустила Kimi K2.5 — мультимодальную модель с открытым кодом, которая обходит GPT-5.2 и Claude Opus 4.5 на ключевых бенчмарках. Компания также представила Kimi Code — агент для программирования, конкурирующий с Claude Code от Anthropic.
Что нового
Kimi K2.5 — нативно мультимодальная модель, понимающая текст, изображения и видео. Обучалась на 15 триллионах смешанных визуальных и текстовых токенов.
Главная фишка — работа с агентными «роями» (agent swarms), когда несколько агентов координируют свои действия для решения сложных задач. Для программистов это означает возможность загружать скриншоты или видео интерфейса и просить модель воспроизвести его в коде.
Технические характеристики:
- Архитектура: MoE (Mixture of Experts)
- Общее число параметров: ~1 триллион
- Активных параметров: 32 миллиарда
- Обучающие данные: 15 триллионов токенов
- Модальности: текст, изображения, видео
- Лицензия: open-source
Производительность
| Бенчмарк | Kimi K2.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3 Pro |
|---|---|---|---|---|
| SWE-Bench Verified | 58.2% | 54.1% | 56.7% | 52.3% |
| SWE-Bench Multilingual | 61.4% | 57.8% | 59.2% | 55.6% |
| VideoMMMU | 72.1% | 68.4% | 69.8% | 71.5% |
На бенчмарке SWE-Bench Verified, который проверяет способность модели решать реальные задачи из GitHub-репозиториев, Kimi K2.5 опережает Gemini 3 Pro. На мультиязычной версии бенчмарка модель лидирует среди всех конкурентов.
В понимании видео (VideoMMMU) Kimi K2.5 превосходит GPT-5.2 и Claude Opus 4.5, уступая только Gemini 3 Pro на десятые доли процента.
Kimi Code — агент для разработчиков
Вместе с моделью компания представила Kimi Code — инструмент командной строки для программирования с AI. Работает через терминал и интегрируется с VSCode, Cursor и Zed.
В отличие от многих конкурентов, Kimi Code принимает на вход не только текст, но и изображения с видео. Можно показать агенту скриншот интерфейса и попросить сверстать аналогичный.
Рынок кодинг-ассистентов растёт взрывными темпами. В ноябре 2025 Anthropic объявила, что Claude Code достиг $1 млрд годовой выручки (ARR). По данным Wired, к концу года инструмент добавил ещё $100 млн.
О компании
Moonshot AI основал Ян Чжилинь, бывший исследователь Google и Meta AI. Компанию поддерживают Alibaba и HongShan (бывший Sequoia China).
Стартап привлёк $1 млрд в раунде Series B при оценке $2.5 млрд. По данным Bloomberg, в декабре 2025 года Moonshot получила ещё $500 млн при оценке $4.3 млрд и уже ищет новый раунд на $5 млрд.
Конкуренция с DeepSeek
Релиз происходит на фоне ожидаемого выхода новой флагманской модели DeepSeek с сильными способностями к кодингу. По данным The Information, DeepSeek планирует релиз в феврале.
Китайские AI-компании всё агрессивнее конкурируют за рынок инструментов для разработчиков, где американские игроки пока доминируют.
Как попробовать
Модель доступна:
- Веса на Hugging Face
- API через платформу Moonshot
- Kimi Code для локальной работы
Для разработчиков, которые ищут open-source альтернативу закрытым моделям с сильным кодингом и мультимодальностью, Kimi K2.5 — серьёзный кандидат для тестирования.


