GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
applem5чипыlocal-llmmacos

Apple M5 Pro и M5 Max: в 4 раза быстрее для LLM

Apple представила чипы M5 Pro и M5 Max на новой Fusion Architecture. До 128 ГБ unified memory, 614 ГБ/с пропускная способность и 4-кратный рост AI-производительности.

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
Apple M5 Pro и M5 Max: в 4 раза быстрее для LLM

128 гигабайт unified memory в ноутбуке. Год назад это звучало как мечта для энтузиастов локальных языковых моделей. С 11 марта — это реальность. Apple представила чипы M5 Pro и M5 Max, и главная цифра, которая интересует AI-сообщество — четырёхкратный рост GPU-производительности для AI по сравнению с предыдущим поколением.

Fusion Architecture: два кристалла, один чип

M5 Pro и M5 Max построены на принципиально новой архитектуре, которую Apple называет Fusion Architecture. Идея проста: два отдельных кристалла на 3-нанометровом техпроцессе (третье поколение) соединяются в единую систему-на-чипе через высокоскоростную шину с низкой задержкой.

Это позволяет Apple масштабировать производительность без необходимости делать один гигантский кристалл, что снижает процент брака при производстве и даёт больше гибкости в конфигурациях.

CPU получил 18 ядер нового типа: 6 «super cores» (бывшие performance-ядра, теперь самые быстрые одноядерные процессоры на рынке по заявлению Apple) и 12 новых ядер эффективности, оптимизированных для многопоточных нагрузок. Прирост многопоточной производительности — до 30% по сравнению с M4 Pro/Max.

Что это значит для LLM

Для сообщества LocalLLaMA на Reddit самое важное — не процессоры, а связка GPU + память.

M5 Max предлагает до 40 ядер GPU нового поколения, каждое из которых оснащено Neural Accelerator. В сочетании с 128 ГБ unified memory и пропускной способностью 614 ГБ/с это создаёт идеальную платформу для инференса больших моделей.

ПараметрM5 ProM5 MaxM4 Max
Ядра CPUдо 18 (6+12)18 (6+12)16
Ядра GPUдо 20до 4040
Unified Memoryдо 64 ГБдо 128 ГБдо 128 ГБ
Пропускная способность307 ГБ/с614 ГБ/с546 ГБ/с
AI GPU compute vs M44x4x
Техпроцесс3 нм (3-е поколение)3 нм (3-е поколение)3 нм

Apple отдельно подчеркнула, что увеличенная пропускная способность памяти означает «higher token generation for LLMs» — компания впервые так явно апеллирует к сценарию использования локальных языковых моделей, упоминая LM Studio на своих промо-материалах.

Для кого это важно

Для тех, кто запускает языковые модели локально, M5 Max с 128 ГБ unified memory — это возможность целиком поместить в память модели вроде Llama 70B в квантизации Q4 или даже DeepSeek V4 в агрессивных квантах. Прирост пропускной способности на 12% по сравнению с M4 Max (614 vs 546 ГБ/с) напрямую транслируется в скорость генерации токенов.

Четырёхкратный рост AI-производительности GPU — более интересная цифра. Она объясняется не только увеличением числа ядер (их осталось 40), а встроенными Neural Accelerators в каждом GPU-ядре. По сути Apple интегрировала специализированные блоки для матричных операций прямо в шейдерные ядра — подход, который NVIDIA реализует через тензорные ядра.

Для разработчиков, работающих с LM Studio, Ollama или llama.cpp на macOS — это, вероятно, самый значимый апгрейд со времён перехода с Intel на Apple Silicon в 2020 году. Unified memory architecture означает, что нет штрафа за перемещение данных между CPU и GPU — весь объём памяти доступен обоим.

Что ещё нового

Помимо AI, чипы получили третье поколение ray-tracing движка (до 35% быстрее), обновлённый 16-ядерный Neural Engine, поддержку Thunderbolt 5 с контроллером прямо на кристалле и аппаратную защиту целостности памяти (Memory Integrity Enforcement) — по заявлению Apple, первую в индустрии без снижения производительности.

MacBook Pro на M5 Pro и M5 Max доступен для предзаказа с 4 марта, продажи начнутся 11 марта. Цены Apple пока не пересмотрела — базовая конфигурация M5 Pro стартует с тех же позиций, что и M4 Pro годом ранее.

Похожие новости

Листайте вниз

для загрузки следующей статьи