GPT Image 2 на горизонте: утечки, «до и после», и закат DALL-E
OpenAI тестирует новую модель генерации изображений на LM Arena под кодовыми именами tape-моделей. DALL-E 2 и 3 уходят на пенсию 12 мая 2026.

Что-то происходит внутри OpenAI. На LM Arena — площадке для слепого тестирования AI-моделей — 4 апреля появились три анонимные модели с необычными именами: packingtape-alpha, maskingtape-alpha и gaffertape-alpha. Через несколько часов они исчезли, но сообщество успело заметить главное: качество генерации значительно превосходит текущий GPT Image 1.5.
Tape-модели: что известно
OpenAI официально не подтвердила связь «tape-моделей» с компанией, но косвенных признаков достаточно. Тестировщики отметили несколько прорывных улучшений.
Текст на изображениях наконец стал читаемым — временные метки, кнопки интерфейса, надписи на вывесках генерируются корректно. Это была одна из главных слабостей предыдущих моделей.
Второе заметное улучшение — «мировое знание». Модели корректно изображали узнаваемые места (кампус Стэнфорда, конференц-зал NeurIPS), интерфейсы реальных приложений и даже конкретных людей. Один тестер отметил, что tape-модель правильно показала время на наручных часах — деталь, которая до сих пор была ахиллесовой пятой генеративных моделей.
При этом модели не безупречны. Тест с отражением кубика Рубика они провалили — зеркальная геометрия остаётся нерешённой задачей.
«До и после» — новый вирусный формат
Параллельно с утечками на Reddit взорвался тренд «до и после» — пользователи загружают свои фотографии в ChatGPT и получают стилизованные или улучшенные версии. Формат мгновенно разлетелся по Instagram и TikTok. Реакция сообщества, впрочем, неоднозначна: часть пользователей отмечает, что Google Nano Banana Pro (модель на базе Gemini) делает подобное уже давно.
Текущее положение дел
Пока tape-модели не вышли публично, актуальным остаётся GPT Image 1.5, выпущенный 16 декабря 2025 года. На лидерборде LM Arena за 9 апреля он занимает второе место в категории text-to-image, уступая Google gemini-3.1-flash-image-preview (Nano Banana 2). В категории редактирования изображений ChatGPT-версия модели лидирует.
| Категория | #1 | #2 |
|---|---|---|
| Text-to-image | Google Nano Banana 2 | GPT Image 1.5 |
| Image editing | ChatGPT Image Latest | GPT Image 1.5 (#5) |
DALL-E уходит
Важная новость для разработчиков: DALL-E 2 и DALL-E 3 будут выведены из эксплуатации 12 мая 2026 года. OpenAI рекомендует мигрировать на GPT Image 1.5. Для тех, кто использует API, уже доступен официальный гайд по миграции.
Переход не косметический — GPT Image 1.5 использует принципиально другую архитектуру. Модель нативно мультимодальна и опирается на «мировое знание» при генерации, а не только на текстовый промпт. Это означает другой подход к промптингу и другие результаты.
Чего ждать
Если tape-модели действительно принадлежат OpenAI, публичный релиз GPT Image 2 может состояться в ближайшие недели. Совпадение с дедлайном DALL-E (12 мая) выглядит не случайным — логично представить новую модель одновременно с закрытием старой.
Конкуренция в генерации изображений обострилась до предела. Google лидирует в бенчмарках, OpenAI — в пользовательском опыте, а Midjourney и Flux продолжают доминировать в специализированных нишах. Tape-модели могут изменить расклад — но только если текстовый рендеринг и «мировое знание» действительно так хороши, как утверждают первые тестеры.

