AMD засветила Ryzen AI MAX+ 495 «Gorgon Halo»: 192 ГБ для локальных LLM

В PassMark всплыл флагманский APU AMD Ryzen AI MAX+ PRO 495 — 16 ядер Zen 5, Radeon 8065S и 192 ГБ единой памяти. На 10% быстрее Strix Halo, до 168 ГБ под GPU.

В базе PassMark на прошлой неделе всплыла странная конфигурация: ноутбук HP с дисплеем 2560×1600 на 120 Гц, 2 ТБ SSD и 188 ГБ оперативной памяти. Чип внутри — AMD Ryzen AI MAX+ PRO 495, кодовое имя «Gorgon Halo». 188 ГБ — это столько свободно после системной разметки; реальная физическая ёмкость — 192 ГБ единой памяти, в полтора раза больше, чем у Strix Halo. Вот почему этот лик — не просто очередной бенчмарк, а заявка на новую категорию железа для локального AI.

Что показал PassMark

Утечка пришла от инсайдера @Olrak29_ и легла на стол PassMark с конкретными цифрами. На многопоточном тесте чип набрал 57 525 баллов — это на 10% больше Ryzen AI MAX+ PRO 395 (предыдущего поколения, Strix Halo) с его 51 778 баллами. Однопоточный счёт — 4293 vs 4086, то есть прирост 5%. Графика — Radeon 8065S — в 3D-тесте показала 18 427 баллов против 18 185 у предшественника Radeon 8060S. То есть GPU практически идентичный по архитектуре, но с чуть более высокими тактовыми частотами.

Самое интересное — память. 192 ГБ распределены через восемь модулей SK hynix LPDDR5X по 24 ГБ. По нынешней архитектуре единой памяти AMD до 87,5% объёма можно отдать под GPU — то есть 168 ГБ доступно как «VRAM». Это меняет арифметику локального инференса: модели вроде Llama 3.3 70B, Qwen 3 80B или DeepSeek V3.2 в FP4-квантизации помещаются на одной коробке без необходимости в Mac Studio M5 Ultra или сборках на нескольких RTX 6000 Pro Blackwell.

Линейка Gorgon Halo

Кроме флагмана, в проспектах засветились ещё пять SKU. Это полноценная линейка для разных ценовых сегментов:

Модель	Ядра / потоки	Макс. частота	GPU	TDP
Ryzen AI MAX+ 495	16 / 32	5,2 ГГц	40 CU (Radeon 8065S)	45–120 Вт
Ryzen AI MAX+ 492	12 / 24	5,0 ГГц	40 CU (Radeon 8065S)	45–120 Вт
Ryzen AI MAX 490	12 / 24	5,0 ГГц	32 CU (Radeon 8055S)	45–120 Вт
Ryzen AI MAX+ 488	8 / 16	5,0 ГГц	40 CU (Radeon 8065S)	45–120 Вт
Ryzen AI MAX 485	8 / 16	5,0 ГГц	32 CU (Radeon 8055S)	45–120 Вт
Ryzen AI MAX 480	6 / 12	5,0 ГГц	16 CU (Radeon 8045S)	45–120 Вт

Архитектурно это всё та же связка Zen 5 + RDNA 3.5 — обновление не радикальное, но с более жирной памятью и приподнятыми частотами. Модель 495 примечательна тем, что у неё 40 CU GPU при 16 ядрах CPU — то есть и для AI-нагрузок, и для рендеринга/гейминга чип становится полноценной заменой связке «ноутбук + внешняя видеокарта».

Почему 192 ГБ — это перелом

До Gorgon Halo рынок AI-ноутбуков и mini-PC выглядел так: можно было купить либо MacBook Pro M5 Max с 128 ГБ, либо коробку Sapphire/Minisforum на Strix Halo с теми же 128 ГБ. На обеих платформах можно было гонять модели до примерно 70B параметров в Q4 или 30B в FP8. Всё, что больше — упиралось в память.

Скачок до 192 ГБ закрывает следующий слой. С 168 ГБ под GPU комфортно работают:

Llama 3.3 70B в FP8 (≈70 ГБ) — с большим контекстом и батчингом
DeepSeek V3.2 685B в Q2 квантизации (≈170 ГБ) — на грани
Qwen 3 80B в FP8 (≈80 ГБ) — с очень длинным контекстом
Локальные MoE модели до 200B параметров в Q4

Apple на этом фоне выглядит интереснее, чем кажется — Mac Studio M5 Ultra даёт до 512 ГБ единой памяти и втрое большую её пропускную способность, чем Halo. Но Studio стоит $5000+ и работает только на macOS со стеком MLX. AMD предлагает x86, Linux, ROCm и Windows на ноутбучном форм-факторе — компромисс между мобильностью и ёмкостью, который пока никто не закрывал.

Что не понятно

Утечка касается только PRO-версии, но обычно не-PRO имеет идентичные характеристики. Что действительно остаётся вопросом — это пропускная способность памяти. В обсуждении на Reddit r/LocalLLaMA уже замечают, что Strix Halo и Strix Halo-производные имели около 256 ГБ/с — это почти втрое медленнее Mac Studio M5 Ultra и в шесть раз медленнее, чем DGX Spark от Nvidia.

Если AMD не поднимет шину памяти, 192 ГБ окажутся ловушкой: модель помещается в память, но генерация выдаёт 5–10 токенов в секунду. Это лучше, чем не помещается совсем, но хуже Mac Studio. Утечка PassMark деталей шины памяти не показывает — узнаем на Computex 2026 в начале июня.

Второе — TDP. 45–120 Вт это широкий диапазон. На 120 Вт чип будет шуметь как игровой ноутбук; в формате тонкого ноута производители скорее ограничат 65 Вт, теряя процент производительности. Производители вроде Asus, HP и Lenovo, скорее всего, выставят 495 в линейке мобильных рабочих станций — это $3000–4000 за конфигурацию.

Что это значит

Для разработчиков локальных LLM это хороший знак. На горизонте 6–9 месяцев появится альтернатива Mac Studio в x86-экосистеме с памятью того же класса, и можно будет не учить MLX с нуля, а гонять привычный llama.cpp/vLLM/Ollama под Linux или Windows. Минус один — пропускная способность памяти, и она важнее частоты.

Для AMD 495 — это попытка занять премиальный сегмент, который раньше брала только Apple. Процесс начался с CES 2026 и анонса Strix Halo, а заканчивается с Gorgon Halo на Computex. После этого AMD будет конкурировать не только в десктопах и серверах, но и в новой нише — «локальный LLM-станция в форм-факторе ноутбука». Nvidia с DGX Spark играет в той же лиге, но за $4000.

Computex 2026 пройдёт 2–6 июня в Тайбэе, и именно тогда AMD скорее всего раскроет полные характеристики линейки и партнёрские SKU. До тех пор 495 — это самый интересный неанонсированный чип года для тех, кто гоняет модели локально.

Что дальше

Релиз ожидается в конце 2026 или начале 2027 года, синхронно с обновлёнными ноутбуками от HP, Asus, Lenovo и Framework. На фоне массового перехода фронтир-моделей на reasoning и агентные задачи (где локальный inference становится критичным для приватности и стоимости) Gorgon Halo может стать тем железом, ради которого специалисты по AI начнут пересматривать свой выбор «MacBook или Linux/Windows». Мы вернёмся к теме после Computex с детальными бенчмарками и реальными ценами.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

AMD засветила Ryzen AI MAX+ 495 «Gorgon Halo»: 192 ГБ для локальных LLM

Что показал PassMark

Линейка Gorgon Halo

Почему 192 ГБ — это перелом

Что не понятно

Что это значит

Что дальше

Похожие новости

DDR5 RDIMM дешевле RTX 3090 — переломный момент для локального AI

«Мы достигли AGI» — и тут же передумал: Дженсен Хуанг на подкасте Лекса Фридмана

3 млрд параметров, золото на олимпиадах — Nemotron-Cascade 2