Gemini 2.5 Flash идёт под нож: Google назначил дату отключения

Google официально обозначил deprecation для Gemini 2.5 Flash и Gemini 2.5 Pro: модели отключат летом 2026. Заменой стала Gemini 3.1 Flash-Lite, которая 7 мая ушла в GA.

Влад Макаровпроверил и опубликовал

16 мая 2026 г.

3 мин чтения

Gemini 2.5 Flash идёт под нож: Google назначил дату отключения

В обсуждениях Google AI для разработчиков на этой неделе всплыло предупреждение: пора переезжать с Gemini 2.5 Flash. Модель, которая весь 2025 год была дефолтным «рабочим конём» для тех, кто не хотел платить за Pro, идёт под нож в июне — Google уже обозначил конкретную дату в официальной документации по deprecations.

Что произошло

Google убрал Gemini 2.5 Flash Live Preview из публичной документации и параллельно объявил полное снятие с поддержки семейства 2.5 Flash. Заменой стала Gemini 3.1 Flash-Lite, которая получила статус GA 7 мая 2026 и официально предлагается как путь миграции.

По заявлению Google, Gemini 3.1 Flash-Lite в 2,5 раза быстрее предшественника, дешевле в эксплуатации и точнее следует инструкциям. Параллельно с этим в публичной документации идёт активная подготовка миграции для Gemini 2.5 Pro — для неё рекомендованной заменой назначена Gemini 3.1 Pro Preview ($2/$12 за миллион токенов). Часть разработчиков жалуется в официальном форуме Google на то, что замены 2.5 Pro в стабильном статусе пока нет — только preview.

Параметры замены:

Цена 2.5 Flash: $0.30 / $2.50 за 1M токенов (input/output)
Цена 3.1 Flash-Lite: $0.25 / $1.50 за 1M токенов
Контекст 2.5 Flash: 1M токенов
Скорость 3.1 Flash-Lite: ×2,5 vs предшественник
Дата отключения 2.5 Flash: июнь 2026

Почему это важно

Gemini 2.5 Flash был самой массовой workhorse-моделью в экосистеме Google: на неё опираются стартапы, агенты, автоматизация чатов, обработка PDF и десятки SaaS-сервисов в Vertex AI. Любой, кто строил продукт на стабильной цене $0.30/$2.50, получает дедлайн на миграцию — не самый удобный сюрприз для команд, которые рассчитывали на год спокойствия.

Google, по сути, делает то же самое, что Anthropic с Claude 3 Haiku и OpenAI с GPT-3.5 Turbo: ускоряет цикл устаревания, чтобы протолкнуть пользователей на новое поколение. Логика прозрачна — 3.1 Flash-Lite дешевле и быстрее, и Google хочет, чтобы массовый трафик уехал туда. Но для прода это значит ещё один цикл регрессионного тестирования: 3.1 Flash-Lite не идентична 2.5 Flash по поведению, и команды отмечают разницу в форматировании JSON, в обработке мультимодальных промптов и в склонности к thinking.

Что дальше

До июня — около шести недель. Тем, кто построил критичный пайплайн на 2.5 Flash, стоит запустить shadow-traffic на 3.1 Flash-Lite уже сейчас и сравнить ответы. Альтернатива — закрепиться на Vertex AI: там старые модели, как правило, живут на полгода-год дольше, чем в публичном API. И присматривать за ценами: $0.25/$1.50 — это не финал; Google уже несколько раз менял прайсинг preview-моделей задним числом перед уходом в GA.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Gemini 2.5 Flash идёт под нож: Google назначил дату отключения

Что произошло

Почему это важно

Что дальше

Похожие новости

Gemini 3.1 Flash-Lite: бюджетная модель Google для массовых задач

Google и SpaceX обсуждают орбитальные ЦОД: 81 спутник с TPU на солнечной энергии

Google остановила первую AI-управляемую массовую атаку