Apple M5 Pro и M5 Max: в 4 раза быстрее для LLM
Apple представила чипы M5 Pro и M5 Max на новой Fusion Architecture. До 128 ГБ unified memory, 614 ГБ/с пропускная способность и 4-кратный рост AI-производительности.

128 гигабайт unified memory в ноутбуке. Год назад это звучало как мечта для энтузиастов локальных языковых моделей. С 11 марта — это реальность. Apple представила чипы M5 Pro и M5 Max, и главная цифра, которая интересует AI-сообщество — четырёхкратный рост GPU-производительности для AI по сравнению с предыдущим поколением.
Fusion Architecture: два кристалла, один чип
M5 Pro и M5 Max построены на принципиально новой архитектуре, которую Apple называет Fusion Architecture. Идея проста: два отдельных кристалла на 3-нанометровом техпроцессе (третье поколение) соединяются в единую систему-на-чипе через высокоскоростную шину с низкой задержкой.
Это позволяет Apple масштабировать производительность без необходимости делать один гигантский кристалл, что снижает процент брака при производстве и даёт больше гибкости в конфигурациях.
CPU получил 18 ядер нового типа: 6 «super cores» (бывшие performance-ядра, теперь самые быстрые одноядерные процессоры на рынке по заявлению Apple) и 12 новых ядер эффективности, оптимизированных для многопоточных нагрузок. Прирост многопоточной производительности — до 30% по сравнению с M4 Pro/Max.
Что это значит для LLM
Для сообщества LocalLLaMA на Reddit самое важное — не процессоры, а связка GPU + память.
M5 Max предлагает до 40 ядер GPU нового поколения, каждое из которых оснащено Neural Accelerator. В сочетании с 128 ГБ unified memory и пропускной способностью 614 ГБ/с это создаёт идеальную платформу для инференса больших моделей.
| Параметр | M5 Pro | M5 Max | M4 Max |
|---|---|---|---|
| Ядра CPU | до 18 (6+12) | 18 (6+12) | 16 |
| Ядра GPU | до 20 | до 40 | 40 |
| Unified Memory | до 64 ГБ | до 128 ГБ | до 128 ГБ |
| Пропускная способность | 307 ГБ/с | 614 ГБ/с | 546 ГБ/с |
| AI GPU compute vs M4 | 4x | 4x | — |
| Техпроцесс | 3 нм (3-е поколение) | 3 нм (3-е поколение) | 3 нм |
Apple отдельно подчеркнула, что увеличенная пропускная способность памяти означает «higher token generation for LLMs» — компания впервые так явно апеллирует к сценарию использования локальных языковых моделей, упоминая LM Studio на своих промо-материалах.
Для кого это важно
Для тех, кто запускает языковые модели локально, M5 Max с 128 ГБ unified memory — это возможность целиком поместить в память модели вроде Llama 70B в квантизации Q4 или даже DeepSeek V4 в агрессивных квантах. Прирост пропускной способности на 12% по сравнению с M4 Max (614 vs 546 ГБ/с) напрямую транслируется в скорость генерации токенов.
Четырёхкратный рост AI-производительности GPU — более интересная цифра. Она объясняется не только увеличением числа ядер (их осталось 40), а встроенными Neural Accelerators в каждом GPU-ядре. По сути Apple интегрировала специализированные блоки для матричных операций прямо в шейдерные ядра — подход, который NVIDIA реализует через тензорные ядра.
Для разработчиков, работающих с LM Studio, Ollama или llama.cpp на macOS — это, вероятно, самый значимый апгрейд со времён перехода с Intel на Apple Silicon в 2020 году. Unified memory architecture означает, что нет штрафа за перемещение данных между CPU и GPU — весь объём памяти доступен обоим.
Что ещё нового
Помимо AI, чипы получили третье поколение ray-tracing движка (до 35% быстрее), обновлённый 16-ядерный Neural Engine, поддержку Thunderbolt 5 с контроллером прямо на кристалле и аппаратную защиту целостности памяти (Memory Integrity Enforcement) — по заявлению Apple, первую в индустрии без снижения производительности.
MacBook Pro на M5 Pro и M5 Max доступен для предзаказа с 4 марта, продажи начнутся 11 марта. Цены Apple пока не пересмотрела — базовая конфигурация M5 Pro стартует с тех же позиций, что и M4 Pro годом ранее.


