Xiaomi 12 Pro превратили в 24/7 AI-сервер. Зачем?
Xiaomi 12 Pro со Snapdragon 8 Gen 1 и 12 ГБ RAM стал круглосуточным локальным AI-узлом. LineageOS, Ollama и Gemma 4 — плюс костыли для жары и батареи.

Телефон четырёхлетней давности, 12 ГБ памяти, Snapdragon 8 Gen 1 и флаг LineageOS — этого хватило, чтобы собрать круглосуточный локальный AI-сервер. Пост с гайдом на r/LocalLLaMA собрал 956 апвоутов и 242 комментария за сутки. Интересно в этой истории не «телефон может запускать модель» — а то, что автор всерьёз подошёл к телефону как к железу для сервера.
Что именно собрали
Устройство — Xiaomi 12 Pro (кодовое имя у LineageOS — zeus). Выпущен в декабре 2021-го, сейчас на вторичке стоит меньше $150. Внутри Snapdragon 8 Gen 1 на 4 нм, восьмиядерный CPU с Cortex-X2 на 3.0 ГГц, GPU Adreno 730, Hexagon NPU седьмого поколения и до 12 ГБ LPDDR5 с пропускной способностью 51.2 ГБ/с.
На нём запущены:
- OS: LineageOS в headless-режиме — без лаунчера, без композитора дисплея
- Runtime: Ollama для локального инференса
- Модель: Gemma 4 в квантованной версии
- Сеть: Wi-Fi через вручную собранный wpa_supplicant, LAN-доступ
- Цена сборки: $150 (сам телефон) плюс внешний кулер
По заявлениям автора, стриппинг Android освобождает около 9 ГБ RAM из 12 под инференс — стоковая MIUI обычно держит 1.5–2 ГБ под систему. Замеров в посте нет, но логика правильная: фоновые сервисы Google, уведомления и вендорский софт на headless-сервере не нужны.
Главное — не модель, а обвес
Самая интересная часть сборки — не выбор Ollama или Gemma 4. Это решения на поверхности. Глубже лежат три хака, которые превращают телефон из консьюмерского устройства в приборчик для серверной нагрузки.
Термоконтроль. Snapdragon 8 Gen 1 известен агрессивным троттлингом под длительной нагрузкой — это следствие того, что он проектировался для бёрстов в играх и фото, а не для постоянной работы. Автор поставил демон, который мониторит температуру CPU и через Wi-Fi-розетку включает внешний кулер при 45 °C. Без этого 24/7-инференс за часы деградирует до нуля из-за термального троттлинга.
Батарейная дисциплина. Скрипт обрезает зарядку на 80%, чтобы снизить деградацию литий-полимерного аккумулятора при постоянном питании. Это стандартная практика для серверов, у которых батарея встроена в корпус. Без такого ограничителя телефон, стоящий на зарядке круглосуточно, превратится в эксперимент по ускоренному старению ячейки.
Фриз Android framework. Автор заморозил фреймворк Android, оставив только сетевой стек. Это превращает устройство из «компьютера с UI» в «SBC с интегрированным ИБП» — батарея становится буфером на случай отключения питания, а Wi-Fi/сотовые радиомодули обеспечивают связь без внешних адаптеров.
Что это даёт в цифрах
Бенчмарков в публичном посте автор не приводит — и это честный сигнал, что сборка пока демонстрационная. Независимой проверки пропускной способности, токенов в секунду или стабильности под нагрузкой нет. Но экономика считается легко.
| Параметр | Xiaomi 12 Pro (б/у) | Raspberry Pi 5 + 16GB | Mac mini M4 |
|---|---|---|---|
| Цена | ~$150 | ~$200 | $599 |
| RAM | 12 ГБ LPDDR5 | 16 ГБ LPDDR4X | 16 ГБ унифицированная |
| NPU | Hexagon (7 поколение) | нет | Neural Engine |
| Батарея (ИБП) | 4600 мА·ч встроенная | внешний UPS | нужен UPS |
| Пропускная способность памяти | 51.2 ГБ/с | 17 ГБ/с | 120 ГБ/с |
Для маленьких квантованных моделей телефон оказывается неплохим компромиссом: память быстрее, чем у Pi, есть NPU, есть встроенный резерв питания. Но ограничения реальны — сустейнд-инференс упирается в термику, а не в вычислительную мощность.
Почему история резонирует
Комментарии под постом на Reddit разделились на два лагеря. Одни пушили llama.cpp на Android вместо Ollama как более эффективный runtime. Другие предлагали USB-C Ethernet с питанием вместо Wi-Fi — чтобы окончательно зафиксировать телефон в роли настольного прибора. Всё это логичные оптимизации, но суть поста в другом.
Миллионы флагманов последних лет уходят на вторичный рынок. Внутри каждого — мощный SoC, быстрая RAM, NPU, батарея, радиомодули, корпус. Отдельно купить эти компоненты дороже — производитель субсидировал железо для мобильных пользователей, а в итоге оно осело на полках. Если к этому прибавить зрелость локальных рантаймов (Ollama, llama.cpp, LM Studio) и компактных моделей (Gemma 4, Qwen 3.5 9B), то сборка домашнего AI-узла из старого смартфона перестаёт быть курьёзом.
Пределы подхода
Честно, в этой истории больше «systems design», чем «AI deployment». Модель запускается — и ладно. Главные достижения автора лежат в термике, питании и фризе системных сервисов. Это работа инфраструктурного инженера, а не ML-энтузиаста.
Жёсткие ограничения тоже никуда не делись:
- Квантованные 9–12B модели ещё как-то помещаются в 9 ГБ, но что-то крупнее — нет
- 24/7-работа без байпаса батареи — это всегда вопрос износа, даже с 80%-кепом
- Пропускная способность памяти и термоусловия телефона фундаментально не годятся для генерации длинных текстов на больших моделях
Что дальше
Предсказание простое: в ближайший год появится прослойка туллинга вокруг превращения старых Android-флагманов в инференс-боксы. Не мейнстрим, но достаточно стандартизованная, чтобы «прошить ROM, поставить сервер, добавить кулер, ограничить заряд» превратилось в повторяемый рецепт.
Интересны тут не компании, которые будут хвастаться «AI на телефоне». Интересны те, кто упакует телефон как инфраструктуру — с прошивкой, термопадом, кабелем PoE и API-слоем наружу. Примерно так же, как в своё время Raspberry Pi перестал быть хобби-платой и стал стандартным компонентом edge-решений.
Xiaomi 12 Pro в этой истории — не герой, а первая ласточка. Настоящая перемена будет, когда кто-то сделает это повторяемым.

