Gemini 2.5 Flash идёт под нож: Google назначил дату отключения
Google официально обозначил deprecation для Gemini 2.5 Flash и Gemini 2.5 Pro: модели отключат летом 2026. Заменой стала Gemini 3.1 Flash-Lite, которая 7 мая ушла в GA.

В обсуждениях Google AI для разработчиков на этой неделе всплыло предупреждение: пора переезжать с Gemini 2.5 Flash. Модель, которая весь 2025 год была дефолтным «рабочим конём» для тех, кто не хотел платить за Pro, идёт под нож в июне — Google уже обозначил конкретную дату в официальной документации по deprecations.
Что произошло
Google убрал Gemini 2.5 Flash Live Preview из публичной документации и параллельно объявил полное снятие с поддержки семейства 2.5 Flash. Заменой стала Gemini 3.1 Flash-Lite, которая получила статус GA 7 мая 2026 и официально предлагается как путь миграции.
По заявлению Google, Gemini 3.1 Flash-Lite в 2,5 раза быстрее предшественника, дешевле в эксплуатации и точнее следует инструкциям. Параллельно с этим в публичной документации идёт активная подготовка миграции для Gemini 2.5 Pro — для неё рекомендованной заменой назначена Gemini 3.1 Pro Preview ($2/$12 за миллион токенов). Часть разработчиков жалуется в официальном форуме Google на то, что замены 2.5 Pro в стабильном статусе пока нет — только preview.
Параметры замены:
- Цена 2.5 Flash: $0.30 / $2.50 за 1M токенов (input/output)
- Цена 3.1 Flash-Lite: $0.25 / $1.50 за 1M токенов
- Контекст 2.5 Flash: 1M токенов
- Скорость 3.1 Flash-Lite: ×2,5 vs предшественник
- Дата отключения 2.5 Flash: июнь 2026
Почему это важно
Gemini 2.5 Flash был самой массовой workhorse-моделью в экосистеме Google: на неё опираются стартапы, агенты, автоматизация чатов, обработка PDF и десятки SaaS-сервисов в Vertex AI. Любой, кто строил продукт на стабильной цене $0.30/$2.50, получает дедлайн на миграцию — не самый удобный сюрприз для команд, которые рассчитывали на год спокойствия.
Google, по сути, делает то же самое, что Anthropic с Claude 3 Haiku и OpenAI с GPT-3.5 Turbo: ускоряет цикл устаревания, чтобы протолкнуть пользователей на новое поколение. Логика прозрачна — 3.1 Flash-Lite дешевле и быстрее, и Google хочет, чтобы массовый трафик уехал туда. Но для прода это значит ещё один цикл регрессионного тестирования: 3.1 Flash-Lite не идентична 2.5 Flash по поведению, и команды отмечают разницу в форматировании JSON, в обработке мультимодальных промптов и в склонности к thinking.
Что дальше
До июня — около шести недель. Тем, кто построил критичный пайплайн на 2.5 Flash, стоит запустить shadow-traffic на 3.1 Flash-Lite уже сейчас и сравнить ответы. Альтернатива — закрепиться на Vertex AI: там старые модели, как правило, живут на полгода-год дольше, чем в публичном API. И присматривать за ценами: $0.25/$1.50 — это не финал; Google уже несколько раз менял прайсинг preview-моделей задним числом перед уходом в GA.


