Llama 3.1 Nemotron Ultra 253B v1
Производная модель с 253 миллиардами параметров от Meta Llama 3.1 405B Instruct, разработанная NVIDIA с использованием Neural Architecture Search (NAS) и вертикального сжатия. Прошла многофазовое пост-обучение (SFT для математики, кода, рассуждений, чата, вызова инструментов; RL с GRPO) для улучшения способностей к рассуждению и следованию инструкциям. Оптимизирована для баланса точности и эффективности на GPU NVIDIA. Поддерживает контекстное окно 128k токенов.
Основные характеристики
Временная шкала
Технические характеристики
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Похожие модели
Все моделиLlama 3.1 Nemotron 70B Instruct
NVIDIA
MiniMax M2
MiniMax
Command R+
Cohere
Jamba 1.5 Large
AI21 Labs
Kimi K2-Instruct-0905
Moonshot AI
GLM-4.5-Air
Zhipu AI
Kimi K2-Thinking-0905
Moonshot AI
GLM-4.5
Zhipu AI
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.