GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
cerebrasopenaiipoai-chipsinferencewafer-scale

Cerebras стоит $60 млрд и крутит секретные GPT-5.5 на своих вафлях

На IPO 14 мая Cerebras оценили в $60 млрд. CFO признался: компания уже обслуживает trillion-parameter модели OpenAI 5.4 и 5.5 на своих wafer-scale чипах.

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
Cerebras стоит $60 млрд и крутит секретные GPT-5.5 на своих вафлях

Десять лет назад Cerebras обещали построить «чип размером с пиццу», и почти все, кто разбирался в железе, крутили пальцем у виска. 14 мая 2026 года эта компания вышла на биржу Nasdaq под тикером CBRS, закрылась на отметке $280 — то есть стоила $60 миллиардов. К концу первого дня торгов CFO Боб Комин дал интервью CNBC, в котором между делом обронил фразу, ставшую самой обсуждаемой в техно-Твиттере на неделю.

«Мы прямо сейчас обслуживаем модели OpenAI 5.4 и 5.5».

Что именно сказали

Когда Дейдра Боса из CNBC попыталась подколоть Комина версией «вы умеете только маленькие модели», CFO Cerebras ответил неожиданно прямо. Не «мы поддерживаем большие модели в теории». Не «у нас будет такая возможность». А «мы прямо сейчас обслуживаем триллионо-параметрические модели, в том числе внутренние модели OpenAI — конкретно 5.4 и 5.5».

Это первое публичное подтверждение, что сделка с OpenAI на 750 МВт инференса, подписанная в апреле, уже работает. По данным Reuters, общая стоимость партнёрства превышает $20 миллиардов на трёхлетний горизонт, включая участие OpenAI в капитале Cerebras.

Для контекста: GPT-5 публично доступна, GPT-5.4 пока используется только внутри OpenAI, а GPT-5.5 — это та самая модель, которая на прошлой неделе за 150 часов автономной работы сама улучшала архитектуру AlphaFold2. Если Cerebras её гоняет, значит, OpenAI считает, что Big Chip справляется с её самым большим продакшен-нагрузкой.

Что такое wafer-scale

Чтобы понять, почему IPO Cerebras — это событие, нужно вспомнить базовую особенность их архитектуры. Обычный AI-ускоритель (H100, B200) — это чип размером с почтовую марку, вырезанный из стандартной 300-мм кремниевой пластины. На одной пластине умещается несколько десятков таких чипов, потом их режут, упаковывают и продают.

Cerebras пошла наоборот: они не режут. Их WSE-3 (Wafer-Scale Engine третьего поколения) — это одна целая пластина размером 215×215 мм, с 900 тысячами процессорных ядер и 44 ГБ on-chip памяти. Между ядрами нет PCIe, нет NVLink, нет вообще никаких внешних шин — данные ходят по самому кремнию со скоростью около 220 петабайт в секунду.

Wafer-Scale Engine 3 от Cerebras Systems: 4 триллиона транзисторов, 900 тысяч ядер, 44 ГБ on-chip памяти Фото: ServeTheHome

Для инференса больших моделей это значит одно: латентность. Нет нужды гонять веса через медленные интерконнекты между десятками GPU — модель целиком живёт на одном «чипе» (это либо одна WSE-3, либо стэк из нескольких в системе CS-3). На бенчмарках Cerebras регулярно показывает в 5–10 раз меньшую latency и в 2–3 раза выше throughput, чем эквивалентный кластер на H100.

Раньше эта архитектура считалась «решением в поисках задачи». В мире, где главное — обучение огромных моделей, Cerebras проигрывала NVIDIA на софтверной экосистеме. Сейчас, когда рынок переходит от тренировки к инференсу, их подход внезапно стал стратегически интересным.

Финансы

Cerebras подала S-1 в апреле, IPO провели 14 мая. По итогам первого дня:

  • Тикер: CBRS на Nasdaq
  • Цена закрытия: $280
  • Рыночная капитализация: ~$60 миллиардов
  • Размер размещения: точная цифра не раскрыта
  • ARR на момент IPO: компания не разглашает, но обсуждается уровень $1–2 млрд

Для сравнения: в декабре 2025 NVIDIA купила Groq за $20 миллиардов, при том что у Groq на тот момент почти не было живых клиентов. Cerebras уже в продакшене у OpenAI, и оценка в три раза выше у Groq выглядит логично.

Почему OpenAI выбрал Cerebras

В апрельском пресс-релизе OpenAI объяснили выбор одной фразой: «снижение latency для real-time AI». В деталях это означает несколько вещей.

ChatGPT в режиме голосового агента и видеовзаимодействия требует ответов с задержкой меньше 200 мс. На обычных GPU-кластерах OpenAI едва укладывается в этот бюджет за счёт сложных оптимизаций маршрутизации, спекулятивного декодирования и параллельной обработки. На Cerebras те же модели работают с задержкой в 50–80 мс — без специальных трюков.

Второй момент — экономика. По расчётам аналитиков, для моделей размером свыше 500B параметров стоимость одного токена на Cerebras WSE-3 примерно вдвое ниже, чем на H100-кластере той же мощности. Для OpenAI, у которой инференс уже превышает 70% всех compute-затрат, это огромная цифра.

Третье — диверсификация. Зависеть только от NVIDIA рискованно. Сделка с Cerebras даёт OpenAI второй источник инференс-мощностей и переговорную позицию.

Что осталось за кадром

Несмотря на бодрый тон Cerebras, остаются три открытых вопроса.

Доля трафика. Komin сказал, что компания обслуживает GPT-5.4 и 5.5. Он не сказал — какую долю запросов. Если это 1% от трафика OpenAI, история становится скучнее. Если 20% — это разворот индустрии.

Доступ к вафлям. Аналитик Андрю Бенсон отметил, что у Cerebras проблемы с поставками от TSMC до как минимум 2028 года. Wafer-scale чип занимает целую 300-мм пластину, что радикально снижает количество единиц, которые можно произвести в месяц.

Софтверная экосистема. PyTorch, vLLM, TensorRT-LLM писались под NVIDIA. У Cerebras свой стек (CSL, Cerebras Software Platform), требующий портирования моделей. OpenAI как один из самых сильных AI-инженерных коллективов в мире справляется. Стартап с командой из пяти человек — вряд ли.

Что это значит для рынка

Для NVIDIA это не катастрофа, но первый серьёзный сигнал. Долгое время Big Chip оставался «дорогой нишей», которую можно было игнорировать. После IPO и подтверждённого использования у OpenAI Cerebras превращается в полноценного конкурента в сегменте large-scale inference.

Для AMD и Intel — повод подумать. Их AI-ускорители (MI300X, Gaudi 3) пытаются соревноваться с NVIDIA на её же поле, на той же архитектуре. Cerebras показала, что можно выиграть, играя в другую игру.

Для стартапов в области AI-чипов — открылось окно. Если рынок готов оценивать «контрарианскую архитектуру» в $60 миллиардов с одним крупным клиентом, ожидайте новых IPO от Tenstorrent, SambaNova, Etched, Taalas в ближайший год. Если Cerebras дойдёт до устойчивой прибыли, шлюзы откроются окончательно.

«Cerebras делала контроверсиальные вещи по правильным причинам, и команда не сдавалась», — написал инвестор Ишан Танеха в комментарии к IPO. Это была единственная стратегия, которая ещё пять лет назад казалась тупиковой. Сегодня её оценили в шестьдесят миллиардов.

Похожие новости

Листайте вниз

для загрузки следующей статьи