GPT-5.2
МультимодальнаяGPT-5.2 демонстрирует значительные улучшения в профессиональных задачах, превосходя экспертов на GDPval с 70.9% побед или ничьих. Устанавливает новые рекорды в программировании (SWE-Bench Pro 55.6%), науке (GPQA Diamond ~92-93%), математике (AIME 2025: 100%), точности работы с длинным контекстом до 256k токенов и надёжном вызове инструментов (Tau2 Telecom 98.7%). Выпускается в вариантах Instant, Thinking и Pro.
Основные характеристики
Временная шкала
Технические характеристики
Ценообразование и доступность
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Другие тесты
Лицензия и метаданные
Статьи о GPT-5.2

OpenAI Codex Desktop: мульти-агентный кодинг приходит на Mac
OpenAI выпустила Codex App для macOS — десктопный центр управления AI-агентами для разработки. Параллельные потоки, Skills, Automations и конкуренция с Claude Code.

Qwen3-Max-Thinking: Alibaba выпустила конкурента o3 и Claude Thinking
Alibaba представила Qwen3-Max-Thinking — reasoning-модель с адаптивным использованием инструментов и multi-round thinking. На ряде бенчмарков опережает GPT-5.2 и Gemini 3 Pro.

Что стоит за Kimi K2.5: команда Moonshot AI о будущем модели
Основатели Moonshot AI раскрыли планы на K3, секреты архитектуры KDA и причины уникального стиля K2.5 в сессии вопросов-ответов на Reddit.

Kimi K2.5: китайская open-source модель обошла GPT-5.2 и Claude Opus в кодинге
Moonshot AI выпустила мультимодальную модель с 1T параметрами и 32B активными. Kimi K2.5 лидирует на SWE-Bench Multilingual и VideoMMMU.

90% кода Claude Code написано самим Claude Code
Anthropic раскрыла статистику: их AI-агент пишет собственный код. Разработчики в восторге, аналитики сомневаются.

ChatGPT и Claude начали цитировать Grokipedia — AI-энциклопедию Маска
Тесты The Guardian показали, что GPT-5.2 использует Grokipedia как источник информации. Это вызывает опасения о распространении дезинформации через языковые модели.

GPT-5.2 Pro побил рекорд на сложнейших математических задачах
Модель OpenAI набрала 31% на FrontierMath Tier 4 — это почти вдвое больше предыдущего рекорда Gemini 3 Pro (19%).

Почему GPT-5 не может решить задачу для трёхлетки
Новый бенчмарк BabyVision показал, что лучшие мультимодальные модели проваливаются на визуальных задачах, которые легко решают дети.

GPT-5.2 решил 6-летнюю математическую задачу
Система Archivara на базе GPT-5.2 Pro и Claude Opus 4.5 нашла новый алгоритм умножения матриц, улучшив результат 2019 года на 14%.

Сотни AI-агентов написали браузер за неделю. Cursor показал будущее разработки
CEO Cursor рассказал, как GPT-5.2 агенты автономно создали работающий браузер FastRender с 3 миллионами строк кода на Rust.
Похожие модели
Все моделиGPT-5.1 High
OpenAI
GPT-5 High
OpenAI
GPT-5.1 Thinking
OpenAI
GPT-5 Medium
OpenAI
GPT-5.1 Instant
OpenAI
GPT-5.1 Medium
OpenAI
GPT-4
OpenAI
GPT-4o
OpenAI
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.