GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
qwenalibabaрелизagentic-codingswe-bench

Qwen3.6-Max-Preview: Alibaba закрыла веса флагмана и забрала шесть бенчмарков

Alibaba выпустила Qwen3.6-Max-Preview с 256K контекстом, лидерством на шести coding-бенчмарках и впервые — без открытых весов.

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
Qwen3.6-Max-Preview: Alibaba закрыла веса флагмана и забрала шесть бенчмарков

Alibaba выпустила Qwen3.6-Max-Preview — самую мощную модель в линейке Qwen, лидера по шести coding-бенчмаркам и первый флагман, который компания шипит как закрытую проприетарную, а не open-weight. Релиз состоялся 20 апреля 2026 года, в тот же день, когда Moonshot выложила open-weight Kimi K2.6. Раскол стратегий между двумя крупнейшими китайскими лабораториями стал максимально наглядным.

Что нового

Главное — закрытые веса. До Qwen3.6-Max каждый релиз Alibaba выкладывался на Hugging Face с пермиссивной коммерческой лицензией. Qwen2, Qwen3, средние и малые варианты Qwen3.6 — все доступны для self-host. С Qwen3.6-Max-Preview эта традиция сломана. Модель доступна только через Qwen Studio (chat.qwen.ai) и Alibaba Cloud Model Studio API под идентификатором qwen3.6-max-preview. Параллельно Alibaba закрыла бесплатный тир Qwen Code — консьюмерского CLI для агентского кодинга. Прицел понятный — монетизировать флагман через облако.

Второе — лидерство в кодинге. По собственной evaluation-сетке Alibaba, Qwen3.6-Max-Preview занимает первое место на шести бенчмарках в категории coding и agent: SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench и SciCode. Два из шести — собственные бенчмарки Alibaba (что не делает результаты бесполезными, но третьесторонняя верификация ещё впереди), но даже четыре оставшихся — серьёзная заявка на агентскую корону.

Третье — двойная API-совместимость. Эндпоинт принимает запросы и в формате OpenAI chat completions, и в формате Anthropic messages. Один и тот же URL, две схемы. Для агентств и команд, у которых уже выстроен пайплайн на любом из двух SDK, переход на Qwen — это смена базового URL и имени модели. Никакой переписывать клиентский код не надо.

Четвёртое — независимая валидация от Artificial Analysis: Intelligence Index 52, третье место из 203 оценённых моделей на момент запуска.

Технические характеристики:

  • Контекст: 256 000 токенов
  • Модальности: только текст на старте (без vision)
  • API: OpenAI и Anthropic specs совместимы
  • Доступ: Qwen Studio + Alibaba Cloud Model Studio
  • Цены: не раскрыты на превью
  • Параметры и архитектура: не раскрыты

Производительность

БенчмаркQwen3.6-PlusQwen3.6-MaxΔ
SciCodeбазовый+10.8агент
SkillsBenchбазовый+9.9агент
NL2Repoбазовый+5.0агент
Terminal-Bench 2.0базовый+3.8агент
QwenChineseBenchбазовый+5.3знания
ToolcallFormatIFBenchбазовый+2.8следование инструкциям
SuperGPQAбазовый+2.3знания

Картина прозрачная. Двузначные приросты на SciCode и SkillsBench показывают, что тренировочный прогон специально рисовал агентский multi-step. Маленькие приросты на SuperGPQA и ToolcallFormatIFBench означают, что мировые знания и instruction-following — это refinement, а не перестройка с нуля. Для энтерпрайзов, у которых RAG-нагрузки тяжелее агентских, апгрейд с Qwen3.6-Plus на Max может оказаться менее заметным, чем заявляет maketing.

Для разработчиков

API совместим с OpenAI SDK — достаточно поменять base_url на dashscope-intl.aliyuncs.com/compatible-mode/v1 и указать модель qwen3.6-max-preview. Тот же endpoint принимает и Anthropic-форматированные запросы — нужно лишь поменять base_url. Это прямая игра за разработчическую ментальность: Alibaba снижает switching cost для команд, которые иначе никогда бы не ушли с GPT или Claude.

Что это значит на фоне Kimi K2.6

Один день, две противоположные стратегии. Moonshot выкладывает K2.6 как open-weight под Modified MIT, со swarm-агентами и нативным video-input. Alibaba выкладывает Qwen3.6-Max как закрытую проприетарную, с упором на coding-benchmarks и API-совместимость. Это не просто разные продуктовые позиции — это разные ставки на то, как победить.

Moonshot ставит на массовый self-host: «возьмите веса, разверните у себя, не платите никому». Alibaba ставит на удобство интеграции и benchmark-лидерство: «один env-vars и вы уже работаете с моделью №3 в мире». Для энтерпрайзов это значит, что выбор «Qwen или Kimi» становится не выбором между двумя моделями, а выбором между двумя архитектурными подходами.

И там, и тут есть ловушки. Qwen3.6-Max заперт в Alibaba Cloud — для большинства американских и европейских клиентов это означает прохождение нового data-residency-аудита, который не каждая команда вытянет. K2.6 open-weight, но идёт с attribution clause для крупных деплоев и тоже требует комплаенс-проверки на китайское происхождение.

Цены

ТарифЦенаЧто включено
Qwen Studioбесплатноchat-интерфейс для тестирования, не для прода
Model Studio API (preview)не раскрытоpay-as-you-go через Alibaba Cloud

Verbosity — это отдельная ценовая статья. Qwen3.6-Max потребил 74M output-токенов во время evaluation Artificial Analysis против 26M у среднего reasoning-модели. Это в 2.8 раза больше, чем у конкурентов. На pay-as-you-go биллинге это означает, что даже более низкая цена за токен может дать более высокую цену за задачу — модель просто говорит больше.

Сравнение с предыдущей версией

Qwen3.6-Plus, прежний флагман, был open-weight и уступал Qwen3.6-Max на агентских бенчмарках с маржей в 4-11 пунктов. С точки зрения «голого качества» апгрейд значимый. С точки зрения экосистемы — это поломка ожиданий: команды, которые планировали self-host флагмана Qwen, теперь должны либо остаться на Plus, либо принять Alibaba Cloud в качестве единственного хостинг-партнёра для Max-уровня.

Открытыми остаются средние и малые варианты Qwen3.6, и Alibaba утверждает, что эта политика сохранится — open для mid-range, closed для флагмана. Похожий split экспериментировала Meta с Llama, и там он не привёл к массовому уходу комьюнити. У Alibaba задача сложнее: ниже по стеку у них нет такого же монопольного бренда, как «Llama» в open-weight мире.

Итог

Кому подойдёт: агентствам и командам, у которых уже выстроен пайплайн на OpenAI или Anthropic SDK и которые хотят конкурировать по цене или по бенчмаркам без переписывания инфраструктуры. Энтерпрайзам в APAC, для которых Alibaba Cloud — нормальный поставщик. Командам, которым нужен топ-3 в Intelligence Index без подписки на closed-source американские модели.

Стоит ли обновляться: если у вас Qwen3.6-Plus в проде — прогоните вашу типичную нагрузку на Max через A/B и считайте per-task стоимость с учётом verbosity. Если ничего на Qwen ещё нет — Qwen3.6-Max-Preview оправдывает попадание в shortlist для оценки, особенно на агентских кодинг-задачах. Главный риск — data-residency. Без чёткой DPA от Alibaba Cloud американские и европейские энтерпрайз-комплаенсы вряд ли пропустят этот ендпоинт в прод с клиентскими данными.


Официальный анонс: qwen.ai/blog

Похожие новости

Листайте вниз

для загрузки следующей статьи