Qwen3.6-Max-Preview: Alibaba закрыла веса флагмана и забрала шесть бенчмарков
Alibaba выпустила Qwen3.6-Max-Preview с 256K контекстом, лидерством на шести coding-бенчмарках и впервые — без открытых весов.

Alibaba выпустила Qwen3.6-Max-Preview — самую мощную модель в линейке Qwen, лидера по шести coding-бенчмаркам и первый флагман, который компания шипит как закрытую проприетарную, а не open-weight. Релиз состоялся 20 апреля 2026 года, в тот же день, когда Moonshot выложила open-weight Kimi K2.6. Раскол стратегий между двумя крупнейшими китайскими лабораториями стал максимально наглядным.
Что нового
Главное — закрытые веса. До Qwen3.6-Max каждый релиз Alibaba выкладывался на Hugging Face с пермиссивной коммерческой лицензией. Qwen2, Qwen3, средние и малые варианты Qwen3.6 — все доступны для self-host. С Qwen3.6-Max-Preview эта традиция сломана. Модель доступна только через Qwen Studio (chat.qwen.ai) и Alibaba Cloud Model Studio API под идентификатором qwen3.6-max-preview. Параллельно Alibaba закрыла бесплатный тир Qwen Code — консьюмерского CLI для агентского кодинга. Прицел понятный — монетизировать флагман через облако.
Второе — лидерство в кодинге. По собственной evaluation-сетке Alibaba, Qwen3.6-Max-Preview занимает первое место на шести бенчмарках в категории coding и agent: SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench и SciCode. Два из шести — собственные бенчмарки Alibaba (что не делает результаты бесполезными, но третьесторонняя верификация ещё впереди), но даже четыре оставшихся — серьёзная заявка на агентскую корону.
Третье — двойная API-совместимость. Эндпоинт принимает запросы и в формате OpenAI chat completions, и в формате Anthropic messages. Один и тот же URL, две схемы. Для агентств и команд, у которых уже выстроен пайплайн на любом из двух SDK, переход на Qwen — это смена базового URL и имени модели. Никакой переписывать клиентский код не надо.
Четвёртое — независимая валидация от Artificial Analysis: Intelligence Index 52, третье место из 203 оценённых моделей на момент запуска.
Технические характеристики:
- Контекст: 256 000 токенов
- Модальности: только текст на старте (без vision)
- API: OpenAI и Anthropic specs совместимы
- Доступ: Qwen Studio + Alibaba Cloud Model Studio
- Цены: не раскрыты на превью
- Параметры и архитектура: не раскрыты
Производительность
| Бенчмарк | Qwen3.6-Plus | Qwen3.6-Max | Δ |
|---|---|---|---|
| SciCode | базовый | +10.8 | агент |
| SkillsBench | базовый | +9.9 | агент |
| NL2Repo | базовый | +5.0 | агент |
| Terminal-Bench 2.0 | базовый | +3.8 | агент |
| QwenChineseBench | базовый | +5.3 | знания |
| ToolcallFormatIFBench | базовый | +2.8 | следование инструкциям |
| SuperGPQA | базовый | +2.3 | знания |
Картина прозрачная. Двузначные приросты на SciCode и SkillsBench показывают, что тренировочный прогон специально рисовал агентский multi-step. Маленькие приросты на SuperGPQA и ToolcallFormatIFBench означают, что мировые знания и instruction-following — это refinement, а не перестройка с нуля. Для энтерпрайзов, у которых RAG-нагрузки тяжелее агентских, апгрейд с Qwen3.6-Plus на Max может оказаться менее заметным, чем заявляет maketing.
Для разработчиков
API совместим с OpenAI SDK — достаточно поменять base_url на dashscope-intl.aliyuncs.com/compatible-mode/v1 и указать модель qwen3.6-max-preview. Тот же endpoint принимает и Anthropic-форматированные запросы — нужно лишь поменять base_url. Это прямая игра за разработчическую ментальность: Alibaba снижает switching cost для команд, которые иначе никогда бы не ушли с GPT или Claude.
Что это значит на фоне Kimi K2.6
Один день, две противоположные стратегии. Moonshot выкладывает K2.6 как open-weight под Modified MIT, со swarm-агентами и нативным video-input. Alibaba выкладывает Qwen3.6-Max как закрытую проприетарную, с упором на coding-benchmarks и API-совместимость. Это не просто разные продуктовые позиции — это разные ставки на то, как победить.
Moonshot ставит на массовый self-host: «возьмите веса, разверните у себя, не платите никому». Alibaba ставит на удобство интеграции и benchmark-лидерство: «один env-vars и вы уже работаете с моделью №3 в мире». Для энтерпрайзов это значит, что выбор «Qwen или Kimi» становится не выбором между двумя моделями, а выбором между двумя архитектурными подходами.
И там, и тут есть ловушки. Qwen3.6-Max заперт в Alibaba Cloud — для большинства американских и европейских клиентов это означает прохождение нового data-residency-аудита, который не каждая команда вытянет. K2.6 open-weight, но идёт с attribution clause для крупных деплоев и тоже требует комплаенс-проверки на китайское происхождение.
Цены
| Тариф | Цена | Что включено |
|---|---|---|
| Qwen Studio | бесплатно | chat-интерфейс для тестирования, не для прода |
| Model Studio API (preview) | не раскрыто | pay-as-you-go через Alibaba Cloud |
Verbosity — это отдельная ценовая статья. Qwen3.6-Max потребил 74M output-токенов во время evaluation Artificial Analysis против 26M у среднего reasoning-модели. Это в 2.8 раза больше, чем у конкурентов. На pay-as-you-go биллинге это означает, что даже более низкая цена за токен может дать более высокую цену за задачу — модель просто говорит больше.
Сравнение с предыдущей версией
Qwen3.6-Plus, прежний флагман, был open-weight и уступал Qwen3.6-Max на агентских бенчмарках с маржей в 4-11 пунктов. С точки зрения «голого качества» апгрейд значимый. С точки зрения экосистемы — это поломка ожиданий: команды, которые планировали self-host флагмана Qwen, теперь должны либо остаться на Plus, либо принять Alibaba Cloud в качестве единственного хостинг-партнёра для Max-уровня.
Открытыми остаются средние и малые варианты Qwen3.6, и Alibaba утверждает, что эта политика сохранится — open для mid-range, closed для флагмана. Похожий split экспериментировала Meta с Llama, и там он не привёл к массовому уходу комьюнити. У Alibaba задача сложнее: ниже по стеку у них нет такого же монопольного бренда, как «Llama» в open-weight мире.
Итог
Кому подойдёт: агентствам и командам, у которых уже выстроен пайплайн на OpenAI или Anthropic SDK и которые хотят конкурировать по цене или по бенчмаркам без переписывания инфраструктуры. Энтерпрайзам в APAC, для которых Alibaba Cloud — нормальный поставщик. Командам, которым нужен топ-3 в Intelligence Index без подписки на closed-source американские модели.
Стоит ли обновляться: если у вас Qwen3.6-Plus в проде — прогоните вашу типичную нагрузку на Max через A/B и считайте per-task стоимость с учётом verbosity. Если ничего на Qwen ещё нет — Qwen3.6-Max-Preview оправдывает попадание в shortlist для оценки, особенно на агентских кодинг-задачах. Главный риск — data-residency. Без чёткой DPA от Alibaba Cloud американские и европейские энтерпрайз-комплаенсы вряд ли пропустят этот ендпоинт в прод с клиентскими данными.
Официальный анонс: qwen.ai/blog

