DeepSeek R1 Distill Qwen 14B
DeepSeek-R1 — это модель рассуждений первого поколения, построенная на основе DeepSeek-V3 (671 миллиард общих параметров, 37 миллиардов активированных на токен). Она использует крупномасштабное обучение с подкреплением (RL) для улучшения своих способностей к цепочке рассуждений и логическому мышлению, демонстрируя высокую производительность в задачах математики, программирования и многоэтапных рассуждений.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
Jamba 1.5 Mini
AI21 Labs
Mistral Small 3 24B Instruct
Mistral AI
DeepSeek R1 Distill Qwen 1.5B
DeepSeek
DeepSeek R1 Distill Qwen 7B
DeepSeek
DeepSeek R1 Distill Llama 8B
DeepSeek
QwQ-32B-Preview
Alibaba
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.