AMD засветила Ryzen AI MAX+ 495 «Gorgon Halo»: 192 ГБ для локальных LLM
В PassMark всплыл флагманский APU AMD Ryzen AI MAX+ PRO 495 — 16 ядер Zen 5, Radeon 8065S и 192 ГБ единой памяти. На 10% быстрее Strix Halo, до 168 ГБ под GPU.

В базе PassMark на прошлой неделе всплыла странная конфигурация: ноутбук HP с дисплеем 2560×1600 на 120 Гц, 2 ТБ SSD и 188 ГБ оперативной памяти. Чип внутри — AMD Ryzen AI MAX+ PRO 495, кодовое имя «Gorgon Halo». 188 ГБ — это столько свободно после системной разметки; реальная физическая ёмкость — 192 ГБ единой памяти, в полтора раза больше, чем у Strix Halo. Вот почему этот лик — не просто очередной бенчмарк, а заявка на новую категорию железа для локального AI.
Что показал PassMark
Утечка пришла от инсайдера @Olrak29_ и легла на стол PassMark с конкретными цифрами. На многопоточном тесте чип набрал 57 525 баллов — это на 10% больше Ryzen AI MAX+ PRO 395 (предыдущего поколения, Strix Halo) с его 51 778 баллами. Однопоточный счёт — 4293 vs 4086, то есть прирост 5%. Графика — Radeon 8065S — в 3D-тесте показала 18 427 баллов против 18 185 у предшественника Radeon 8060S. То есть GPU практически идентичный по архитектуре, но с чуть более высокими тактовыми частотами.
Самое интересное — память. 192 ГБ распределены через восемь модулей SK hynix LPDDR5X по 24 ГБ. По нынешней архитектуре единой памяти AMD до 87,5% объёма можно отдать под GPU — то есть 168 ГБ доступно как «VRAM». Это меняет арифметику локального инференса: модели вроде Llama 3.3 70B, Qwen 3 80B или DeepSeek V3.2 в FP4-квантизации помещаются на одной коробке без необходимости в Mac Studio M5 Ultra или сборках на нескольких RTX 6000 Pro Blackwell.
Линейка Gorgon Halo
Кроме флагмана, в проспектах засветились ещё пять SKU. Это полноценная линейка для разных ценовых сегментов:
| Модель | Ядра / потоки | Макс. частота | GPU | TDP |
|---|---|---|---|---|
| Ryzen AI MAX+ 495 | 16 / 32 | 5,2 ГГц | 40 CU (Radeon 8065S) | 45–120 Вт |
| Ryzen AI MAX+ 492 | 12 / 24 | 5,0 ГГц | 40 CU (Radeon 8065S) | 45–120 Вт |
| Ryzen AI MAX 490 | 12 / 24 | 5,0 ГГц | 32 CU (Radeon 8055S) | 45–120 Вт |
| Ryzen AI MAX+ 488 | 8 / 16 | 5,0 ГГц | 40 CU (Radeon 8065S) | 45–120 Вт |
| Ryzen AI MAX 485 | 8 / 16 | 5,0 ГГц | 32 CU (Radeon 8055S) | 45–120 Вт |
| Ryzen AI MAX 480 | 6 / 12 | 5,0 ГГц | 16 CU (Radeon 8045S) | 45–120 Вт |
Архитектурно это всё та же связка Zen 5 + RDNA 3.5 — обновление не радикальное, но с более жирной памятью и приподнятыми частотами. Модель 495 примечательна тем, что у неё 40 CU GPU при 16 ядрах CPU — то есть и для AI-нагрузок, и для рендеринга/гейминга чип становится полноценной заменой связке «ноутбук + внешняя видеокарта».
Почему 192 ГБ — это перелом
До Gorgon Halo рынок AI-ноутбуков и mini-PC выглядел так: можно было купить либо MacBook Pro M5 Max с 128 ГБ, либо коробку Sapphire/Minisforum на Strix Halo с теми же 128 ГБ. На обеих платформах можно было гонять модели до примерно 70B параметров в Q4 или 30B в FP8. Всё, что больше — упиралось в память.
Скачок до 192 ГБ закрывает следующий слой. С 168 ГБ под GPU комфортно работают:
- Llama 3.3 70B в FP8 (≈70 ГБ) — с большим контекстом и батчингом
- DeepSeek V3.2 685B в Q2 квантизации (≈170 ГБ) — на грани
- Qwen 3 80B в FP8 (≈80 ГБ) — с очень длинным контекстом
- Локальные MoE модели до 200B параметров в Q4
Apple на этом фоне выглядит интереснее, чем кажется — Mac Studio M5 Ultra даёт до 512 ГБ единой памяти и втрое большую её пропускную способность, чем Halo. Но Studio стоит $5000+ и работает только на macOS со стеком MLX. AMD предлагает x86, Linux, ROCm и Windows на ноутбучном форм-факторе — компромисс между мобильностью и ёмкостью, который пока никто не закрывал.
Что не понятно
Утечка касается только PRO-версии, но обычно не-PRO имеет идентичные характеристики. Что действительно остаётся вопросом — это пропускная способность памяти. В обсуждении на Reddit r/LocalLLaMA уже замечают, что Strix Halo и Strix Halo-производные имели около 256 ГБ/с — это почти втрое медленнее Mac Studio M5 Ultra и в шесть раз медленнее, чем DGX Spark от Nvidia.
Если AMD не поднимет шину памяти, 192 ГБ окажутся ловушкой: модель помещается в память, но генерация выдаёт 5–10 токенов в секунду. Это лучше, чем не помещается совсем, но хуже Mac Studio. Утечка PassMark деталей шины памяти не показывает — узнаем на Computex 2026 в начале июня.
Второе — TDP. 45–120 Вт это широкий диапазон. На 120 Вт чип будет шуметь как игровой ноутбук; в формате тонкого ноута производители скорее ограничат 65 Вт, теряя процент производительности. Производители вроде Asus, HP и Lenovo, скорее всего, выставят 495 в линейке мобильных рабочих станций — это $3000–4000 за конфигурацию.
Что это значит
Для разработчиков локальных LLM это хороший знак. На горизонте 6–9 месяцев появится альтернатива Mac Studio в x86-экосистеме с памятью того же класса, и можно будет не учить MLX с нуля, а гонять привычный llama.cpp/vLLM/Ollama под Linux или Windows. Минус один — пропускная способность памяти, и она важнее частоты.
Для AMD 495 — это попытка занять премиальный сегмент, который раньше брала только Apple. Процесс начался с CES 2026 и анонса Strix Halo, а заканчивается с Gorgon Halo на Computex. После этого AMD будет конкурировать не только в десктопах и серверах, но и в новой нише — «локальный LLM-станция в форм-факторе ноутбука». Nvidia с DGX Spark играет в той же лиге, но за $4000.
Computex 2026 пройдёт 2–6 июня в Тайбэе, и именно тогда AMD скорее всего раскроет полные характеристики линейки и партнёрские SKU. До тех пор 495 — это самый интересный неанонсированный чип года для тех, кто гоняет модели локально.
Что дальше
Релиз ожидается в конце 2026 или начале 2027 года, синхронно с обновлёнными ноутбуками от HP, Asus, Lenovo и Framework. На фоне массового перехода фронтир-моделей на reasoning и агентные задачи (где локальный inference становится критичным для приватности и стоимости) Gorgon Halo может стать тем железом, ради которого специалисты по AI начнут пересматривать свой выбор «MacBook или Linux/Windows». Мы вернёмся к теме после Computex с детальными бенчмарками и реальными ценами.


