Cerebras стоит $60 млрд и крутит секретные GPT-5.5 на своих вафлях
На IPO 14 мая Cerebras оценили в $60 млрд. CFO признался: компания уже обслуживает trillion-parameter модели OpenAI 5.4 и 5.5 на своих wafer-scale чипах.

Десять лет назад Cerebras обещали построить «чип размером с пиццу», и почти все, кто разбирался в железе, крутили пальцем у виска. 14 мая 2026 года эта компания вышла на биржу Nasdaq под тикером CBRS, закрылась на отметке $280 — то есть стоила $60 миллиардов. К концу первого дня торгов CFO Боб Комин дал интервью CNBC, в котором между делом обронил фразу, ставшую самой обсуждаемой в техно-Твиттере на неделю.
«Мы прямо сейчас обслуживаем модели OpenAI 5.4 и 5.5».
Что именно сказали
Когда Дейдра Боса из CNBC попыталась подколоть Комина версией «вы умеете только маленькие модели», CFO Cerebras ответил неожиданно прямо. Не «мы поддерживаем большие модели в теории». Не «у нас будет такая возможность». А «мы прямо сейчас обслуживаем триллионо-параметрические модели, в том числе внутренние модели OpenAI — конкретно 5.4 и 5.5».
Это первое публичное подтверждение, что сделка с OpenAI на 750 МВт инференса, подписанная в апреле, уже работает. По данным Reuters, общая стоимость партнёрства превышает $20 миллиардов на трёхлетний горизонт, включая участие OpenAI в капитале Cerebras.
Для контекста: GPT-5 публично доступна, GPT-5.4 пока используется только внутри OpenAI, а GPT-5.5 — это та самая модель, которая на прошлой неделе за 150 часов автономной работы сама улучшала архитектуру AlphaFold2. Если Cerebras её гоняет, значит, OpenAI считает, что Big Chip справляется с её самым большим продакшен-нагрузкой.
Что такое wafer-scale
Чтобы понять, почему IPO Cerebras — это событие, нужно вспомнить базовую особенность их архитектуры. Обычный AI-ускоритель (H100, B200) — это чип размером с почтовую марку, вырезанный из стандартной 300-мм кремниевой пластины. На одной пластине умещается несколько десятков таких чипов, потом их режут, упаковывают и продают.
Cerebras пошла наоборот: они не режут. Их WSE-3 (Wafer-Scale Engine третьего поколения) — это одна целая пластина размером 215×215 мм, с 900 тысячами процессорных ядер и 44 ГБ on-chip памяти. Между ядрами нет PCIe, нет NVLink, нет вообще никаких внешних шин — данные ходят по самому кремнию со скоростью около 220 петабайт в секунду.
Фото: ServeTheHome
Для инференса больших моделей это значит одно: латентность. Нет нужды гонять веса через медленные интерконнекты между десятками GPU — модель целиком живёт на одном «чипе» (это либо одна WSE-3, либо стэк из нескольких в системе CS-3). На бенчмарках Cerebras регулярно показывает в 5–10 раз меньшую latency и в 2–3 раза выше throughput, чем эквивалентный кластер на H100.
Раньше эта архитектура считалась «решением в поисках задачи». В мире, где главное — обучение огромных моделей, Cerebras проигрывала NVIDIA на софтверной экосистеме. Сейчас, когда рынок переходит от тренировки к инференсу, их подход внезапно стал стратегически интересным.
Финансы
Cerebras подала S-1 в апреле, IPO провели 14 мая. По итогам первого дня:
- Тикер: CBRS на Nasdaq
- Цена закрытия: $280
- Рыночная капитализация: ~$60 миллиардов
- Размер размещения: точная цифра не раскрыта
- ARR на момент IPO: компания не разглашает, но обсуждается уровень $1–2 млрд
Для сравнения: в декабре 2025 NVIDIA купила Groq за $20 миллиардов, при том что у Groq на тот момент почти не было живых клиентов. Cerebras уже в продакшене у OpenAI, и оценка в три раза выше у Groq выглядит логично.
Почему OpenAI выбрал Cerebras
В апрельском пресс-релизе OpenAI объяснили выбор одной фразой: «снижение latency для real-time AI». В деталях это означает несколько вещей.
ChatGPT в режиме голосового агента и видеовзаимодействия требует ответов с задержкой меньше 200 мс. На обычных GPU-кластерах OpenAI едва укладывается в этот бюджет за счёт сложных оптимизаций маршрутизации, спекулятивного декодирования и параллельной обработки. На Cerebras те же модели работают с задержкой в 50–80 мс — без специальных трюков.
Второй момент — экономика. По расчётам аналитиков, для моделей размером свыше 500B параметров стоимость одного токена на Cerebras WSE-3 примерно вдвое ниже, чем на H100-кластере той же мощности. Для OpenAI, у которой инференс уже превышает 70% всех compute-затрат, это огромная цифра.
Третье — диверсификация. Зависеть только от NVIDIA рискованно. Сделка с Cerebras даёт OpenAI второй источник инференс-мощностей и переговорную позицию.
Что осталось за кадром
Несмотря на бодрый тон Cerebras, остаются три открытых вопроса.
Доля трафика. Komin сказал, что компания обслуживает GPT-5.4 и 5.5. Он не сказал — какую долю запросов. Если это 1% от трафика OpenAI, история становится скучнее. Если 20% — это разворот индустрии.
Доступ к вафлям. Аналитик Андрю Бенсон отметил, что у Cerebras проблемы с поставками от TSMC до как минимум 2028 года. Wafer-scale чип занимает целую 300-мм пластину, что радикально снижает количество единиц, которые можно произвести в месяц.
Софтверная экосистема. PyTorch, vLLM, TensorRT-LLM писались под NVIDIA. У Cerebras свой стек (CSL, Cerebras Software Platform), требующий портирования моделей. OpenAI как один из самых сильных AI-инженерных коллективов в мире справляется. Стартап с командой из пяти человек — вряд ли.
Что это значит для рынка
Для NVIDIA это не катастрофа, но первый серьёзный сигнал. Долгое время Big Chip оставался «дорогой нишей», которую можно было игнорировать. После IPO и подтверждённого использования у OpenAI Cerebras превращается в полноценного конкурента в сегменте large-scale inference.
Для AMD и Intel — повод подумать. Их AI-ускорители (MI300X, Gaudi 3) пытаются соревноваться с NVIDIA на её же поле, на той же архитектуре. Cerebras показала, что можно выиграть, играя в другую игру.
Для стартапов в области AI-чипов — открылось окно. Если рынок готов оценивать «контрарианскую архитектуру» в $60 миллиардов с одним крупным клиентом, ожидайте новых IPO от Tenstorrent, SambaNova, Etched, Taalas в ближайший год. Если Cerebras дойдёт до устойчивой прибыли, шлюзы откроются окончательно.
«Cerebras делала контроверсиальные вещи по правильным причинам, и команда не сдавалась», — написал инвестор Ишан Танеха в комментарии к IPO. Это была единственная стратегия, которая ещё пять лет назад казалась тупиковой. Сегодня её оценили в шестьдесят миллиардов.


