DeepSeek R1 Zero
DeepSeek-R1-Zero, модель, обученная с использованием крупномасштабного обучения с подкреплением (RL) без предварительного этапа контролируемой настройки (SFT), продемонстрировала замечательную производительность в рассуждениях. Благодаря RL, DeepSeek-R1-Zero естественным образом развила множество мощных и интересных поведенческих паттернов рассуждений. Однако DeepSeek-R1-Zero сталкивается с такими проблемами, как бесконечные повторения, плохая читаемость и смешение языков. Для решения этих проблем и дальнейшего улучшения производительности рассуждений мы представляем DeepSeek-R1, которая включает данные холодного старта перед RL. DeepSeek-R1 достигает производительности, сопоставимой с OpenAI-o1, в задачах математики, программирования и рассуждений.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиDeepSeek-V3 0324
DeepSeek
DeepSeek-R1-0528
DeepSeek
DeepSeek-V3
DeepSeek
DeepSeek-V3.2-Exp
DeepSeek
DeepSeek-V3.1
DeepSeek
DeepSeek-R1
DeepSeek
DeepSeek-V3.2-Speciale
DeepSeek
DeepSeek-V3.2 (Non-thinking)
DeepSeek
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.