DeepSeek R1 Distill Qwen 7B
DeepSeek-R1 — это модель рассуждений первого поколения, построенная на базе DeepSeek-V3 (671 миллиард параметров всего, 37 миллиардов активируется на токен). Она использует крупномасштабное обучение с подкреплением для улучшения своих способностей к пошаговому мышлению и рассуждениям, демонстрируя высокую производительность в задачах математики, программирования и многоэтапных рассуждений.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek R1 Distill Llama 8B
DeepSeek
DeepSeek R1 Distill Qwen 1.5B
DeepSeek
Llama 3.1 Nemotron Nano 8B V1
NVIDIA
Phi 4 Mini Reasoning
Microsoft
DeepSeek R1 Distill Qwen 14B
DeepSeek
DeepSeek R1 Distill Llama 70B
DeepSeek
DeepSeek R1 Distill Qwen 32B
DeepSeek
DeepSeek-V2.5
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.