GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
googlegeminiio-2026agentsвидеогенерация

Google I/O 2026: эра агентского Gemini — Omni, Spark и 3.5 Flash

Google показала на I/O 2026 модель Gemini Omni для видеогенерации, агента Gemini Spark и Gemini 3.5 Flash. Что это значит для рынка ИИ.

Влад МакаровВлад Макаровпроверил и опубликовал
8 мин чтения
Google I/O 2026: эра агентского Gemini — Omni, Spark и 3.5 Flash

3,2 квадриллиона токенов в месяц. Столько Google прокачивает через свои модели по состоянию на май 2026 — рост в семь раз за год. Эту цифру Сундар Пичаи поставил во главу угла открывающего кейноута I/O 2026, и она задаёт тон всему, что Google анонсировала во вторник: масштаб уже такой, что компания решила переписать собственную инфраструктуру и перестроить продукты вокруг агентов.

Что показали на сцене

Главных анонса три: новая мультимодальная модель Gemini Omni, флагман Gemini 3.5 Flash и персональный агент Gemini Spark, который должен заменить обычное общение с чат-ботом. Параллельно Google показала восьмое поколение TPU, разделённое на два чипа — TPU 8t для обучения и TPU 8i для инференса — и пообещала рост капексов до 180–190 млрд долларов в 2026 году. Это в шесть раз больше, чем компания тратила на инфраструктуру в 2022-м.

Gemini Omni — это «world model», которая принимает любую модальность на входе и выдаёт видео на выходе. По описанию Google, можно загрузить ролик и попросить «поменять, что происходит»: модель отредактирует действие, добавит персонажей или объекты. Первая версия называется Gemini Omni Flash, она запущена в Gemini-приложении, Google Flow и YouTube Shorts, в ближайшие недели появится в API. Со временем семейство Omni научится выдавать ещё и изображения, и текст.

Gemini Spark — это персональный агент в приложении Gemini, который работает 24/7 на виртуальных машинах Google Cloud. Он построен поверх Gemini 3.5 и оркестрационного фреймворка Antigravity. Spark обещают научить длинным фоновым задачам — от наведения порядка в почте до поиска информации, который выполняется без присутствия пользователя. В Chrome он со временем должен превратиться в полноценный агентский браузер. Раскатка начинается с подписчиков Google AI Ultra в США на следующей неделе.

Что нового в моделях

Gemini 3.5 Flash — главный коммерческий продукт релиза. Google говорит, что Flash сравним с фронтирными моделями по интеллекту, но «в четыре раза быстрее» по выдаче токенов и стоит «вдвое или втрое дешевле» сопоставимых конкурентов. Внутри Google эту модель уже используют для собственной разработки: в марте инструменты разработки прожигали полтриллиона токенов в день, сейчас — больше трёх триллионов. Старшая версия, Gemini 3.5 Pro, готова частично и выйдет в июне.

Цифры из заявленного позиционирования:

  • Gemini-приложение: 900 млн ежемесячных активных пользователей (год назад — 400 млн).
  • AI Mode в поиске: 1 млрд пользователей за год после запуска.
  • AI Overviews: 2,5 млрд ежемесячных активных пользователей.
  • 8,5 млн разработчиков ежемесячно строят что-то на моделях Google.

«Если бы топовые компании переключили 80% нагрузки с других фронтирных моделей на 3.5 Flash, они сэкономили бы более 1 млрд долларов в год», — посчитал Пичаи. Это прямой выпад в сторону Anthropic и OpenAI: дорогие фронтирные модели на длинной дистанции бьют по бюджетам, и Google продаёт Flash как «компромиссный» вариант, который не такой компромиссный, как кажется.

Агенты повсюду

Agentic — главное слово I/O 2026. Помимо Spark, Google анонсировала:

  • Antigravity 2.0 — десктопное приложение для оркестрации агентов, не привязанное к коду. Внутри уже работает «12x ускоренная» версия Flash.
  • Daily Brief — агент в Gemini-приложении, который синтезирует утренний дайджест из почты, календаря и задач.
  • Информационные агенты в Поиске — фоновые задачи, которые ищут нужное «в нужный момент». Запуск летом для подписчиков AI Pro/Ultra в США.
  • Generative UI в Поиске — Google Antigravity строит динамические интерфейсы под конкретный запрос. Будет бесплатно для всех.
  • Ask YouTube — естественный диалог с роликами, переход сразу к нужному моменту видео.
  • Docs Live — голосовое создание документов: пользователь надиктовывает мысли, Gemini пишет.

Отдельно стоит история с очками. Google подтвердила, что осенью 2026 года выйдут аудио-очки с Gemini в наушнике, а позже — версии с дисплеем. Это первая попытка компании вернуться в категорию после провала Google Glass с поправкой на десять лет прогресса в моделях.

Инфраструктура и борьба за дешёвый инференс

История с TPU 8t и 8i — про то, что Google разделила задачу. TPU 8t заточен под обучение, выдаёт почти втрое больше «сырых» вычислений по сравнению с предыдущим поколением и работает с распределённым обучением через JAX и Pathways. Google утверждает, что может разносить тренировку по нескольким датацентрам и масштабироваться на больше миллиона TPU одновременно. TPU 8i предназначен исключительно для инференса — компания подчёркивает, что после 27 лет работы над Поиском они «знают, что задержки решают».

Оба чипа дают примерно двукратный прирост производительности на ватт. Google явно бьёт в больную точку индустрии: расходы на инференс уже превышают расходы на обучение, и здесь TPU 8i — прямой ответ на NVIDIA Blackwell и Rubin.

SynthID и согласие с OpenAI

В отдельной секции Пичаи объявил, что OpenAI, Kakao и ElevenLabs подключились к SynthID — системе невидимой водяной маркировки контента, сгенерированного ИИ. Это редкий случай, когда конкуренты публично договариваются о едином стандарте: водяной знак Google уже стоит на 100 млрд изображений, видео и 60 тысячах лет аудио. Контент Credentials (стандарт C2PA) и проверка SynthID расширяются на Поиск и Chrome.

В контексте усиливающихся дебатов о deepfake — Google ссылается на исследование, что люди правильно распознают высококачественные deepfake-видео только в четверти случаев — это попытка зафиксировать индустриальный стандарт прозрачности до того, как регуляторы введут свой.

Что это значит

Для разработчиков релиз 3.5 Flash меняет экономику. Если Google не врёт про скорость и цену, то для большинства повседневных задач Flash становится разумным дефолтом вместо Claude Sonnet или GPT — особенно для всего, что упирается в латентность. Pro остаётся нишевым решением для тяжёлых задач рассуждения.

Для рынка агентов главная новость — это Spark и Antigravity 2.0. Google впервые предлагает массовому пользователю агента, который живёт в облаке и не требует, чтобы ноутбук был открыт. Это прямой ответ на ChatGPT Agent и Claude Cowork: Google поставила инфраструктурную ставку, что агенты будут жить на серверах провайдера, а не на устройстве пользователя.

Для Anthropic и OpenAI всё это сигнал, что Google наконец перестала догонять. Год назад на I/O 2025 компания показывала AI Mode как эксперимент. Сегодня этот эксперимент — миллиард пользователей. Gemini-приложение удвоилось за год, ежедневные запросы выросли в семь раз. И всё это — на фоне готовящихся IPO конкурентов, у которых нет ни TPU, ни сопоставимой пользовательской базы.

Что дальше

Gemini 3.5 Pro обещают в июне. Spark выйдет из бета-режима для AI Ultra на следующей неделе, информационные агенты в Поиске — летом. Очки с Gemini — осенью. Каждый из этих анонсов — отдельная история, и каждая — про то, что Google больше не пытается доказать, что умеет в ИИ. Теперь компания пытается доказать, что умеет монетизировать масштаб.

Главный вопрос на следующий год: смогут ли OpenAI и Anthropic, у которых сейчас триллионные оценки, удержать темп против компании с собственными чипами, тремя миллиардами пользователей и бюджетом на капекс в 190 миллиардов долларов.

Похожие новости

Листайте вниз

для загрузки следующей статьи