Qwen 3.5: Alibaba бросает вызов GPT-5 мультимодальной агентной моделью
Alibaba выпустила Qwen 3.5 — мультимодальную модель с 397B параметрами и поддержкой агентных сценариев. Разбираем архитектуру, бенчмарки и что это значит для рынка.

Шесть дней — и 120 миллионов обращений через API. Такими цифрами Alibaba отмечает запуск Qwen 3.5, модели, которая претендует на звание сильнейшего open-source решения в мире. Пока западные лаборатории спорят о закрытых моделях, команда Qwen выкладывает на GitHub под Apache 2.0 модель, сопоставимую с Gemini 3 Pro.
Что под капотом
Qwen 3.5 — это не просто языковая модель с прикрученным зрением. Alibaba впервые применила ранний фьюжн при обучении: текст и изображения обрабатываются как единый поток токенов с самого начала предтренировки. Результат — модель одинаково уверенно работает с текстом, изображениями и видео, при этом не проседая в чисто текстовых задачах.
Архитектурно Qwen 3.5 использует гибридный Mixture-of-Experts с 397 миллиардами параметров, из которых при инференсе активируется лишь 17 миллиардов — менее 5%. Это делает модель в 19 раз быстрее предшественника Qwen3-Max (модель с триллионом+ параметров) при сопоставимом качестве на ключевых бенчмарках по рассуждению и коду.
Гибридный механизм внимания заслуживает отдельного разговора. Вместо того чтобы каждый токен «смотрел» на весь контекст (что делает вычисления всё дороже с ростом длины текста), Qwen 3.5 динамически фокусирует внимание. Это позволяет эффективно работать с контекстным окном в 1 миллион токенов без экспоненциального роста стоимости.
Добавьте к этому нативную мультитокенную предикцию — модель генерирует несколько токенов за один шаг, ещё больше ускоряя инференс.
Ключевые характеристики:
- Параметры: 397B всего, 17B активных (MoE)
- Контекст: 1M токенов
- Модальности: текст, изображения, видео (вход), текст (выход)
- Лицензия: Apache 2.0
- Инференс: доступен через Alibaba Cloud, NVIDIA NIM, Hugging Face
Бенчмарки: где Qwen 3.5 стоит
Команда Qwen позиционирует модель как конкурента не только open-source решениям, но и закрытым фронтирам. По данным Alibaba и независимых тестов, Qwen3.5-Plus (API-версия) сопоставима с Gemini 3 Pro по целому ряду бенчмарков.
В визуальном понимании — отдельная история. Благодаря раннему фьюжну модель не просто «описывает картинку», а понимает пространственное расположение объектов, читает графики и таблицы, работает с видео. По MathVision и AI2D Qwen 3.5 показывает результаты на уровне или выше специализированных vision-language моделей.
Но главное — агентные возможности. Qwen 3.5 изначально проектировалась для эры агентного AI: function calling, tool use, RAG, сложные многошаговые воркфлоу. Alibaba уже выпустила Qwen Code — open-source терминальный агент, оптимизированный под модели семейства, и Qwen-Agent — фреймворк для разработки агентов.
Контекст: почему это важно сейчас
За последний месяц китайские лаборатории устроили настоящую гонку релизов. DeepSeek V4, Doubao Seed 2.0 от ByteDance, и вот теперь Qwen 3.5. Каждая из этих моделей не просто «ещё один чат-бот» — это полноценные платформы для построения AI-систем.
Для Alibaba ставки особенно высоки. Компания параллельно развернула пузырьковую маркетинговую кампанию с бесплатным чаем, благодаря которой Qwen обогнал Yuanbao от Tencent в китайском App Store. 120 миллионов API-запросов за шесть дней — цифра, которая показывает масштаб спроса.
Важен и политический контекст. Председатель Си Цзиньпин публично объявил курс на «AI-plus» — интеграцию искусственного интеллекта во все отрасли экономики. Qwen 3.5, доступная под Apache 2.0, идеально вписывается в эту стратегию: любая китайская компания может взять модель и адаптировать под свои задачи без лицензионных ограничений.
Что это меняет для разработчиков
Появление Qwen 3.5 серьёзно меняет расклад для тех, кто строит AI-приложения. До сих пор мультимодальные агентные модели были прерогативой закрытых API — GPT-5, Gemini 3 Pro, Claude Opus. Теперь есть open-source альтернатива, которую можно запустить локально, файнтюнить и интегрировать без зависимости от сторонних провайдеров.
Модель уже доступна через NVIDIA NIM, llama.cpp, MLX (для Apple Silicon), а также через vLLM и SGLang для продакшн-деплоя. Для enterprise-пользователей — Alibaba Cloud и Qwen API с конкурентным прайсингом.
Разрыв между open-source и проприетарными моделями продолжает сокращаться. Если Qwen 3.5 действительно держит заявленный уровень в продакшн-сценариях, у многих команд появится серьёзный повод пересмотреть зависимость от закрытых API. Особенно в регионах, где доступ к американским сервисам нестабилен.


