Apple M5 Pro и M5 Max: в 4 раза быстрее для LLM

Apple представила чипы M5 Pro и M5 Max на новой Fusion Architecture. До 128 ГБ unified memory, 614 ГБ/с пропускная способность и 4-кратный рост AI-производительности.

128 гигабайт unified memory в ноутбуке. Год назад это звучало как мечта для энтузиастов локальных языковых моделей. С 11 марта — это реальность. Apple представила чипы M5 Pro и M5 Max, и главная цифра, которая интересует AI-сообщество — четырёхкратный рост GPU-производительности для AI по сравнению с предыдущим поколением.

Fusion Architecture: два кристалла, один чип

M5 Pro и M5 Max построены на принципиально новой архитектуре, которую Apple называет Fusion Architecture. Идея проста: два отдельных кристалла на 3-нанометровом техпроцессе (третье поколение) соединяются в единую систему-на-чипе через высокоскоростную шину с низкой задержкой.

Это позволяет Apple масштабировать производительность без необходимости делать один гигантский кристалл, что снижает процент брака при производстве и даёт больше гибкости в конфигурациях.

CPU получил 18 ядер нового типа: 6 «super cores» (бывшие performance-ядра, теперь самые быстрые одноядерные процессоры на рынке по заявлению Apple) и 12 новых ядер эффективности, оптимизированных для многопоточных нагрузок. Прирост многопоточной производительности — до 30% по сравнению с M4 Pro/Max.

Что это значит для LLM

Для сообщества LocalLLaMA на Reddit самое важное — не процессоры, а связка GPU + память.

M5 Max предлагает до 40 ядер GPU нового поколения, каждое из которых оснащено Neural Accelerator. В сочетании с 128 ГБ unified memory и пропускной способностью 614 ГБ/с это создаёт идеальную платформу для инференса больших моделей.

Параметр	M5 Pro	M5 Max	M4 Max
Ядра CPU	до 18 (6+12)	18 (6+12)	16
Ядра GPU	до 20	до 40	40
Unified Memory	до 64 ГБ	до 128 ГБ	до 128 ГБ
Пропускная способность	307 ГБ/с	614 ГБ/с	546 ГБ/с
AI GPU compute vs M4	4x	4x	—
Техпроцесс	3 нм (3-е поколение)	3 нм (3-е поколение)	3 нм

Apple отдельно подчеркнула, что увеличенная пропускная способность памяти означает «higher token generation for LLMs» — компания впервые так явно апеллирует к сценарию использования локальных языковых моделей, упоминая LM Studio на своих промо-материалах.

Для кого это важно

Для тех, кто запускает языковые модели локально, M5 Max с 128 ГБ unified memory — это возможность целиком поместить в память модели вроде Llama 70B в квантизации Q4 или даже DeepSeek V4 в агрессивных квантах. Прирост пропускной способности на 12% по сравнению с M4 Max (614 vs 546 ГБ/с) напрямую транслируется в скорость генерации токенов.

Четырёхкратный рост AI-производительности GPU — более интересная цифра. Она объясняется не только увеличением числа ядер (их осталось 40), а встроенными Neural Accelerators в каждом GPU-ядре. По сути Apple интегрировала специализированные блоки для матричных операций прямо в шейдерные ядра — подход, который NVIDIA реализует через тензорные ядра.

Для разработчиков, работающих с LM Studio, Ollama или llama.cpp на macOS — это, вероятно, самый значимый апгрейд со времён перехода с Intel на Apple Silicon в 2020 году. Unified memory architecture означает, что нет штрафа за перемещение данных между CPU и GPU — весь объём памяти доступен обоим.

Что ещё нового

Помимо AI, чипы получили третье поколение ray-tracing движка (до 35% быстрее), обновлённый 16-ядерный Neural Engine, поддержку Thunderbolt 5 с контроллером прямо на кристалле и аппаратную защиту целостности памяти (Memory Integrity Enforcement) — по заявлению Apple, первую в индустрии без снижения производительности.

MacBook Pro на M5 Pro и M5 Max доступен для предзаказа с 4 марта, продажи начнутся 11 марта. Цены Apple пока не пересмотрела — базовая конфигурация M5 Pro стартует с тех же позиций, что и M4 Pro годом ранее.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Apple M5 Pro и M5 Max: в 4 раза быстрее для LLM

Fusion Architecture: два кристалла, один чип

Что это значит для LLM

Для кого это важно

Что ещё нового

Похожие новости

Разобрать Apple изнутри: как исследователь вскрыл Neural Engine M4

Siri на Gemini 1.2T: что реально выйдет в iOS 26.4 и что задержалось

Siri научится видеть экран: что Apple готовит в iOS 26.4