Qwen3-Next-80B-A3B-Instruct
Qwen3-Next-80B-A3B-Instruct — первая модель серии Qwen3-Next с прорывными архитектурными инновациями. Использует гибридное внимание (Gated DeltaNet + Gated Attention) для эффективного моделирования сверхдлинного контекста, MoE с высокой разреженностью (512 экспертов, 10 активных + 1 общий) и предсказание нескольких токенов. 80 млрд параметров (3 млрд активных), обучена на 15T токенах. Превосходит Qwen3-32B-Base при 10% стоимости обучения. Поддержка контекста до 256K (расширяемо до 1M с YaRN). Лицензия Apache 2.0.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиQwen3 30B A3B
Alibaba
Qwen2.5 14B Instruct
Alibaba
QwQ-32B-Preview
Alibaba
Qwen2.5 72B Instruct
Alibaba
Qwen3 32B
Alibaba
QwQ-32B
Alibaba
Qwen2.5 32B Instruct
Alibaba
Qwen2 72B Instruct
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.