DeepSeek R1 Distill Qwen 1.5B
DeepSeek-R1 — это модель рассуждений первого поколения, построенная на основе DeepSeek-V3 (671 миллиард параметров общего объема, 37 миллиардов активных параметров на токен). Модель использует крупномасштабное обучение с подкреплением (RL) для улучшения своих способностей к цепочке рассуждений и логическому мышлению, демонстрируя высокую производительность в задачах по математике, программированию и многоэтапным рассуждениям.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek R1 Distill Qwen 7B
DeepSeek
DeepSeek R1 Distill Llama 8B
DeepSeek
DeepSeek R1 Distill Qwen 14B
DeepSeek
DeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
DeepSeek-R1
DeepSeek
DeepSeek-V2.5
DeepSeek
DeepSeek-V3
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.