DeepSeek R1 Distill Llama 8B
DeepSeek-R1 — это модель рассуждений первого поколения, построенная на основе DeepSeek-V3 (671 миллиард общих параметров, 37 миллиардов активируемых на токен). Она использует крупномасштабное обучение с подкреплением (RL) для улучшения своих способностей к цепочке рассуждений и логическому мышлению, демонстрируя высокую производительность в математических задачах, программировании и многоэтапных рассуждениях.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek R1 Distill Qwen 7B
DeepSeek
DeepSeek R1 Distill Qwen 1.5B
DeepSeek
Llama 3.1 Nemotron Nano 8B V1
NVIDIA
Phi 4 Mini Reasoning
Microsoft
DeepSeek R1 Distill Qwen 14B
DeepSeek
DeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
DeepSeek-V3.2-Speciale
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.