Llama 3.1 Nemotron Ultra 253B v1
Производная модель с 253 миллиардами параметров от Meta Llama 3.1 405B Instruct, разработанная NVIDIA с использованием Neural Architecture Search (NAS) и вертикального сжатия. Прошла многофазовое пост-обучение (SFT для математики, кода, рассуждений, чата, вызова инструментов; RL с GRPO) для улучшения способностей к рассуждению и следованию инструкциям. Оптимизирована для баланса точности и эффективности на GPU NVIDIA. Поддерживает контекстное окно 128k токенов.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиNemotron 3 Nano (30B A3B)
NVIDIA
Llama 3.1 Nemotron 70B Instruct
NVIDIA
Jamba 1.5 Large
AI21 Labs
DeepSeek-V3.1
DeepSeek
MiniMax M2
MiniMax
Llama 3.1 405B Instruct
Meta
DeepSeek R1 Zero
DeepSeek
Command R+
Cohere
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.