GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
openaiгенерация-изображенийgpt-imagedall-eрелиз

GPT Image 2 на горизонте: утечки, «до и после», и закат DALL-E

OpenAI тестирует новую модель генерации изображений на LM Arena под кодовыми именами tape-моделей. DALL-E 2 и 3 уходят на пенсию 12 мая 2026.

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
GPT Image 2 на горизонте: утечки, «до и после», и закат DALL-E

Что-то происходит внутри OpenAI. На LM Arena — площадке для слепого тестирования AI-моделей — 4 апреля появились три анонимные модели с необычными именами: packingtape-alpha, maskingtape-alpha и gaffertape-alpha. Через несколько часов они исчезли, но сообщество успело заметить главное: качество генерации значительно превосходит текущий GPT Image 1.5.

Tape-модели: что известно

OpenAI официально не подтвердила связь «tape-моделей» с компанией, но косвенных признаков достаточно. Тестировщики отметили несколько прорывных улучшений.

Текст на изображениях наконец стал читаемым — временные метки, кнопки интерфейса, надписи на вывесках генерируются корректно. Это была одна из главных слабостей предыдущих моделей.

Второе заметное улучшение — «мировое знание». Модели корректно изображали узнаваемые места (кампус Стэнфорда, конференц-зал NeurIPS), интерфейсы реальных приложений и даже конкретных людей. Один тестер отметил, что tape-модель правильно показала время на наручных часах — деталь, которая до сих пор была ахиллесовой пятой генеративных моделей.

При этом модели не безупречны. Тест с отражением кубика Рубика они провалили — зеркальная геометрия остаётся нерешённой задачей.

«До и после» — новый вирусный формат

Параллельно с утечками на Reddit взорвался тренд «до и после» — пользователи загружают свои фотографии в ChatGPT и получают стилизованные или улучшенные версии. Формат мгновенно разлетелся по Instagram и TikTok. Реакция сообщества, впрочем, неоднозначна: часть пользователей отмечает, что Google Nano Banana Pro (модель на базе Gemini) делает подобное уже давно.

Текущее положение дел

Пока tape-модели не вышли публично, актуальным остаётся GPT Image 1.5, выпущенный 16 декабря 2025 года. На лидерборде LM Arena за 9 апреля он занимает второе место в категории text-to-image, уступая Google gemini-3.1-flash-image-preview (Nano Banana 2). В категории редактирования изображений ChatGPT-версия модели лидирует.

Категория#1#2
Text-to-imageGoogle Nano Banana 2GPT Image 1.5
Image editingChatGPT Image LatestGPT Image 1.5 (#5)

DALL-E уходит

Важная новость для разработчиков: DALL-E 2 и DALL-E 3 будут выведены из эксплуатации 12 мая 2026 года. OpenAI рекомендует мигрировать на GPT Image 1.5. Для тех, кто использует API, уже доступен официальный гайд по миграции.

Переход не косметический — GPT Image 1.5 использует принципиально другую архитектуру. Модель нативно мультимодальна и опирается на «мировое знание» при генерации, а не только на текстовый промпт. Это означает другой подход к промптингу и другие результаты.

Чего ждать

Если tape-модели действительно принадлежат OpenAI, публичный релиз GPT Image 2 может состояться в ближайшие недели. Совпадение с дедлайном DALL-E (12 мая) выглядит не случайным — логично представить новую модель одновременно с закрытием старой.

Конкуренция в генерации изображений обострилась до предела. Google лидирует в бенчмарках, OpenAI — в пользовательском опыте, а Midjourney и Flux продолжают доминировать в специализированных нишах. Tape-модели могут изменить расклад — но только если текстовый рендеринг и «мировое знание» действительно так хороши, как утверждают первые тестеры.

Похожие новости

Листайте вниз

для загрузки следующей статьи