Qwen 3.5: Alibaba бросает вызов GPT-5 мультимодальной агентной моделью

Alibaba выпустила Qwen 3.5 — мультимодальную модель с 397B параметрами и поддержкой агентных сценариев. Разбираем архитектуру, бенчмарки и что это значит для рынка.

Шесть дней — и 120 миллионов обращений через API. Такими цифрами Alibaba отмечает запуск Qwen 3.5, модели, которая претендует на звание сильнейшего open-source решения в мире. Пока западные лаборатории спорят о закрытых моделях, команда Qwen выкладывает на GitHub под Apache 2.0 модель, сопоставимую с Gemini 3 Pro.

Что под капотом

Qwen 3.5 — это не просто языковая модель с прикрученным зрением. Alibaba впервые применила ранний фьюжн при обучении: текст и изображения обрабатываются как единый поток токенов с самого начала предтренировки. Результат — модель одинаково уверенно работает с текстом, изображениями и видео, при этом не проседая в чисто текстовых задачах.

Архитектурно Qwen 3.5 использует гибридный Mixture-of-Experts с 397 миллиардами параметров, из которых при инференсе активируется лишь 17 миллиардов — менее 5%. Это делает модель в 19 раз быстрее предшественника Qwen3-Max (модель с триллионом+ параметров) при сопоставимом качестве на ключевых бенчмарках по рассуждению и коду.

Гибридный механизм внимания заслуживает отдельного разговора. Вместо того чтобы каждый токен «смотрел» на весь контекст (что делает вычисления всё дороже с ростом длины текста), Qwen 3.5 динамически фокусирует внимание. Это позволяет эффективно работать с контекстным окном в 1 миллион токенов без экспоненциального роста стоимости.

Добавьте к этому нативную мультитокенную предикцию — модель генерирует несколько токенов за один шаг, ещё больше ускоряя инференс.

Ключевые характеристики:

Параметры: 397B всего, 17B активных (MoE)
Контекст: 1M токенов
Модальности: текст, изображения, видео (вход), текст (выход)
Лицензия: Apache 2.0
Инференс: доступен через Alibaba Cloud, NVIDIA NIM, Hugging Face

Бенчмарки: где Qwen 3.5 стоит

Команда Qwen позиционирует модель как конкурента не только open-source решениям, но и закрытым фронтирам. По данным Alibaba и независимых тестов, Qwen3.5-Plus (API-версия) сопоставима с Gemini 3 Pro по целому ряду бенчмарков.

В визуальном понимании — отдельная история. Благодаря раннему фьюжну модель не просто «описывает картинку», а понимает пространственное расположение объектов, читает графики и таблицы, работает с видео. По MathVision и AI2D Qwen 3.5 показывает результаты на уровне или выше специализированных vision-language моделей.

Но главное — агентные возможности. Qwen 3.5 изначально проектировалась для эры агентного AI: function calling, tool use, RAG, сложные многошаговые воркфлоу. Alibaba уже выпустила Qwen Code — open-source терминальный агент, оптимизированный под модели семейства, и Qwen-Agent — фреймворк для разработки агентов.

Контекст: почему это важно сейчас

За последний месяц китайские лаборатории устроили настоящую гонку релизов. DeepSeek V4, Doubao Seed 2.0 от ByteDance, и вот теперь Qwen 3.5. Каждая из этих моделей не просто «ещё один чат-бот» — это полноценные платформы для построения AI-систем.

Для Alibaba ставки особенно высоки. Компания параллельно развернула пузырьковую маркетинговую кампанию с бесплатным чаем, благодаря которой Qwen обогнал Yuanbao от Tencent в китайском App Store. 120 миллионов API-запросов за шесть дней — цифра, которая показывает масштаб спроса.

Важен и политический контекст. Председатель Си Цзиньпин публично объявил курс на «AI-plus» — интеграцию искусственного интеллекта во все отрасли экономики. Qwen 3.5, доступная под Apache 2.0, идеально вписывается в эту стратегию: любая китайская компания может взять модель и адаптировать под свои задачи без лицензионных ограничений.

Что это меняет для разработчиков

Появление Qwen 3.5 серьёзно меняет расклад для тех, кто строит AI-приложения. До сих пор мультимодальные агентные модели были прерогативой закрытых API — GPT-5, Gemini 3 Pro, Claude Opus. Теперь есть open-source альтернатива, которую можно запустить локально, файнтюнить и интегрировать без зависимости от сторонних провайдеров.

Модель уже доступна через NVIDIA NIM, llama.cpp, MLX (для Apple Silicon), а также через vLLM и SGLang для продакшн-деплоя. Для enterprise-пользователей — Alibaba Cloud и Qwen API с конкурентным прайсингом.

Разрыв между open-source и проприетарными моделями продолжает сокращаться. Если Qwen 3.5 действительно держит заявленный уровень в продакшн-сценариях, у многих команд появится серьёзный повод пересмотреть зависимость от закрытых API. Особенно в регионах, где доступ к американским сервисам нестабилен.