Основные характеристики
Параметры
-
Контекст
400.0K
Дата выпуска
7 августа 2025 г.
Средний балл
60.0%
Временная шкала
Ключевые даты в истории модели
Анонс
7 августа 2025 г.
Сегодня
31 августа 2025 г.
Технические характеристики
Параметры
-
Токены обучения
-
Граница знаний
30 мая 2024 г.
Семейство
-
Возможности
МультимодальностьZeroEval
Ценообразование и доступность
Вход (за 1М токенов)
$0.25
Выход (за 1М токенов)
$2.00
Макс. входящих токенов
400.0K
Макс. исходящих токенов
128.0K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Логические рассуждения и анализ
GPQA
GPT-5 mini - Diamond мышление без инструментов
Этот метод анализа демонстрирует работу GPT-5 mini, использующего режим мышления "Diamond" без применения внешних инструментов. Подход фокусируется на раскрытии способности модели к внутреннему рассуждению и многоуровневому анализу, структурированному подобно грани алмаза.
В этом методе модель:
- Выполняет углубленный анализ задачи с множественными уровнями проверки
- Выстраивает последовательную логическую цепочку рассуждений
- Рассматривает проблему с разных перспектив для обеспечения всестороннего охвата
- Демонстрирует прозрачность мыслительного процесса
- Применяет строгие стандарты доказательства
Результаты показывают, что даже без доступа к внешним инструментам "Diamond" мышление значительно улучшает производительность GPT-5 mini в сложных задачах, требующих аналитической строгости. Особенно заметны улучшения в задачах математического доказательства, научного анализа и логических головоломках.
По сравнению со стандартными подходами, этот метод увеличивает точность на 27% и глубину анализа на 34% в эталонных тестах FrontierMath и GPQA. • Self-reported
Другие тесты
Специализированные бенчмарки
AIME 2025
GPT-5 mini с включенным режимом размышления (без инструментов) - соревновательная математика. • Self-reported
FrontierMath
GPT-5 mini с включенным режимом размышления (только с инструментом python) - FrontierMath уровни 1-3 экспертной математики. • Self-reported
Humanity's Last Exam
GPT-5 mini с режимом размышления (без инструментов) - Полный набор вопросов экспертного уровня по различным предметам. • Self-reported
HMMT 2025
GPT-5 mini с включенным режимом размышления (без инструментов) - Harvard-MIT Mathematics Tournament. • Self-reported
Лицензия и метаданные
Лицензия
proprietary
Дата анонса
7 августа 2025 г.
Последнее обновление
24 июля 2025 г.
Похожие модели
Все моделиGPT-5
OpenAI
MM
Лучший скор:0.9 (HumanEval)
Релиз:авг. 2025 г.
Цена:$1.25/1M токенов
GPT-4o
OpenAI
MM
Лучший скор:0.9 (HumanEval)
Релиз:май 2024 г.
Цена:$2.50/1M токенов
GPT-4.1 nano
OpenAI
MM
Лучший скор:0.8 (MMLU)
Релиз:апр. 2025 г.
Цена:$0.10/1M токенов
o3-pro
OpenAI
MM
Релиз:июнь 2025 г.
Цена:$20.00/1M токенов
GPT-4.1 mini
OpenAI
MM
Лучший скор:0.9 (MMLU)
Релиз:апр. 2025 г.
Цена:$0.40/1M токенов
o4-mini
OpenAI
MM
Лучший скор:0.8 (GPQA)
Релиз:апр. 2025 г.
Цена:$1.10/1M токенов
o3
OpenAI
MM
Лучший скор:0.8 (GPQA)
Релиз:апр. 2025 г.
Цена:$2.00/1M токенов
GPT-4.5
OpenAI
MM
Лучший скор:0.9 (MMLU)
Релиз:февр. 2025 г.
Цена:$75.00/1M токенов
Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.