GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
nvidiagrootcosmoshumanoid-robotsphysical-aijetson-thorboston-dynamics

NVIDIA выпустила GR00T N1.6 и Cosmos Reason 2: новый стек для гуманоидов

На CES 2026 NVIDIA показала обновлённый стек физического AI — GR00T N1.6 на базе Cosmos VLM, новые open-модели мира и Jetson T4000 за $1999. Boston Dynamics, Franka, NEURA уже встроили.

Влад МакаровВлад Макаровпроверил и опубликовал
8 мин чтения
NVIDIA выпустила GR00T N1.6 и Cosmos Reason 2: новый стек для гуманоидов

«ChatGPT-момент для робототехники наступил». Эта фраза Дженсена Хуанга открыла презентацию NVIDIA на CES 2026 — и из маркетингового лозунга начала обрастать инфраструктурой. На сцене стояли Boston Dynamics, Caterpillar, Franka Robotics, NEURA, LG, Humanoid и AGIBOT. Все — на одном технологическом стеке: Cosmos для генерации синтетических данных, Reason для понимания мира, GR00T для контроля тела. И железо Jetson T4000 за $1999 в качестве фундамента.

Что нового в GR00T N1.6

GR00T N1.6 — это VLA-модель (vision-language-action), оптимизированная под гуманоиды и опубликованная как open-weight на Hugging Face. Она берёт изображения с камер робота, естественный язык в качестве инструкции и выдаёт последовательность действий — углы суставов, движения захватов, перемещения тела. По сравнению с N1.5 — несколько архитектурных и data-инженерных изменений, которые дают заметный прирост на реальных задачах.

Главный апгрейд — новый VLM-бэкбон. Вместо предыдущего варианта используется внутренняя версия NVIDIA Cosmos-2B, которая поддерживает гибкое разрешение и кодирует изображения в нативном соотношении сторон без паддинга. Это критично для роботов: камеры на разных платформах дают разный аспект, и модель, которая не теряет данные на этапе препроцессинга, лучше переносится между телами.

Второе — DiT (diffusion transformer) увеличен в два раза: 32 слоя против 16 в N1.5. Третье — убран отдельный 4-слойный адаптер после VLM, вместо этого размораживаются верхние 4 слоя самого VLM во время предобучения. Это означает, что модель учится «думать в эмбеддингах», а не «переводить из VLM в action-space через прокладку». Четвёртое — переход на относительные действия (state-relative action chunks) для большинства тел вместо абсолютных углов суставов или координат захвата. Относительные действия дают более плавные движения и лучшую устойчивость к шуму, но требуют аккуратной регуляризации, чтобы избежать накопления ошибок.

Технические характеристики:

  • Базовый VLM: внутренний NVIDIA Cosmos-2B
  • DiT-блок: 32 слоя (vs 16 в N1.5)
  • Pretraining: 300K шагов, глобальный батч 16384
  • Post-training: 10K-30K шагов, батч до 1K
  • Размер модели: 3B параметров (вариант на Hugging Face)
  • Поддерживаемые тела: bimanual YAM, AGIBot Genie-1, Unitree G1, Galaxea R1 Pro

Cosmos: четвёртое измерение стека

Параллельно с GR00T NVIDIA выпустила обновления Cosmos — это open-source семейство моделей, которое работает «под капотом» у GR00T и у конкурентов. Три новые модели:

  • Cosmos Transfer 2.5 — модель мира для генерации синтетических данных. Берёт сцену и генерит физически правдоподобные вариации: разное освещение, текстуры, расположение объектов. Это решает главную проблему обучения роботов — нехватку реальных демонстраций.
  • Cosmos Predict 2.5 — модель предсказания будущих кадров. Робот может «представить», что произойдёт через секунду, и спланировать действие. Используется для оценки политик в симуляции без необходимости запускать реальное железо.
  • Cosmos Reason 2 — open VLM для рассуждений в физическом мире. Это слой «понимания», который интегрируется в GR00T и позволяет роботу не просто выполнить команду «положи кружку на полку», но рассудить, что полка занята, и принять решение убрать с неё что-то ещё.

Reason 2 уже используется не только в GR00T. Salesforce применяет Cosmos Reason для анализа видео с собственных роботов через Agentforce — это сократило время решения инцидентов в два раза. LEM Surgical использует Cosmos Transfer и Isaac for Healthcare для тренировки автономных манипуляторов хирургического робота Dynamis на Jetson AGX Thor.

Кто уже встроил

Список партнёров — это, по сути, who-is-who мировой робототехники. Jetson Thor встроили Boston Dynamics (в гуманоид Atlas), Humanoid (компания, специально названная этим словом), RLWRLD. NEURA Robotics показала на CES сразу два новых робота: спроектированный совместно с Porsche гуманоид Gen 3 для индустриальных задач и компактную модель для тонкой манипуляции. AGIBOT представил гуманоидов для индустрии и потребительского сегмента, а также собственную симуляцию Genie Sim 3.0, интегрированную с Isaac Sim.

LG Electronics, которая обычно ассоциируется с холодильниками и телевизорами, вышла на сцену с домашним роботом для бытовых задач — конкурентом Optimus Tesla на семейный сегмент. Caterpillar расширила сотрудничество с NVIDIA для применения AI в строительной и горной технике — CEO Caterpillar Джо Крид выступит совместно с Дипу Таллой, вице-президентом NVIDIA по робототехнике, в отдельном кейноуте.

Параллельно NVIDIA и Hugging Face объявили о глубокой интеграции открытых моделей Isaac и GR00T в LeRobot — главный open-source фреймворк робототехники. Это объединяет два сообщества: 2 миллиона разработчиков NVIDIA и 13 миллионов AI-билдеров Hugging Face. Reachy 2 — humanoid от Hugging Face — будет полностью совместим с Jetson Thor, и на него можно будет запускать любую VLA-модель, включая GR00T N1.6.

Jetson T4000: железо за $1999

Без процессора весь софт остаётся на серверах. NVIDIA одновременно выпустила Jetson T4000 — модуль на архитектуре Blackwell, который должен заменить Jetson Orin для нового поколения автономных машин. Цена — $1999 за единицу при заказе 1000 штук. Это в четыре раза мощнее предыдущего поколения: 1200 TFLOPS в FP4, 64 ГБ памяти, 70 Вт TDP в конфигурируемом исполнении.

ПараметрJetson Orin (предыдущий)Jetson T4000 (новый)
АрхитектураAmpereBlackwell
TDPдо 60 Вт70 Вт (настраиваемый)
AI-производительность275 TOPS (INT8)1200 TFLOPS (FP4)
Память64 ГБ LPDDR564 ГБ
Цена за 1000 шт$1499$1999
Прирост производительностибазовый

Дополнительно — IGX Thor для индустриального edge с поддержкой functional safety и enterprise-софта. Archer (производитель eVTOL) уже использует IGX Thor для систем безопасности самолётов. Партнёры по платформе — AAEON, Advantech, ADLINK, Aetina, AVerMedia, Connect Tech и десяток других — выпускают свои системы на базе T4000.

Что это значит

Картина стала чёткой. NVIDIA закрыла полный стек: от тренировочных пайплайнов (OSMO) и симуляции (Isaac Lab-Arena, Isaac Sim) до моделей фундамента (Cosmos, GR00T) и железа на роботе (Jetson T4000, IGX Thor). Конкурировать с этим стеком как стартапу — практически невозможно, и потому почти все западные производители гуманоидов выбрали стратегию «строим тело, мозг берём у NVIDIA».

Для разработчиков это означает, что барьер входа в физический AI резко упал. Раньше, чтобы построить гуманоида, нужно было нанимать команду из 50 ML-исследователей и тратить год на тренировку базовой модели управления. Сейчас можно скачать GR00T N1.6 с Hugging Face, дофайнтюнить на тысяче демонстраций своей задачи и развернуть на Jetson T4000. Время от идеи до работающего прототипа сократилось с лет до месяцев.

Для бизнеса главное, что робототехника на Хаггингфейсе стала самой быстрорастущей категорией, и open-source модели NVIDIA лидируют по скачиваниям. Это значит, что цикл «исследование → продукт» работает в индустрии, а не только в академии. Полгода назад статья из NVIDIA Research через год превращалась в академический бенчмарк. Сейчас — через месяц превращается в коммерческий стартап.

Что дальше

В чём GR00T N1.6 ещё проигрывает — это многозадачность с языком и обобщение на out-of-distribution задачи. NVIDIA в своей публикации честно признаёт: «Многозадачное следование языку и обобщение на новые задачи остаются сложными для текущих VLA-моделей. Более детальная аннотация подзадач улучшает следование языку, но не достигает надёжного обобщения». Это, видимо, главный фронт работ для N1.7 или N2.

Параллельно NVIDIA выпустит больше open-source инструментов — Isaac Lab-Arena как инфраструктура для бенчмаркинга политик, OSMO для оркестрации обучающих пайплайнов. Стек продолжает обрастать слоями. И каждый из этих слоёв — open-source. Это не filantropy, а стратегия: чем больше людей строит на NVIDIA-стеке, тем больше железа NVIDIA нужно покупать.

В итоге CES 2026 был не про роботов. Он был про инфраструктуру роботов. И эту инфраструктуру выкатил один игрок.

Похожие новости

Листайте вниз

для загрузки следующей статьи