OpenAI logo

o4-mini

Мультимодальная
OpenAI

o4-mini — это новейшая малая модель серии o от OpenAI, оптимизированная для быстрого и эффективного рассуждения с исключительно высокой производительностью в задачах программирования и визуальной обработки. Она работает быстрее и стоит дешевле, чем o3.

Основные характеристики

Параметры
-
Контекст
200.0K
Дата выпуска
16 апреля 2025 г.
Средний балл
66.5%

Временная шкала

Ключевые даты в истории модели
Анонс
16 апреля 2025 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
-
Токены обучения
-
Граница знаний
31 мая 2024 г.
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$1.10
Выход (за 1М токенов)
$4.40
Макс. входящих токенов
200.0K
Макс. исходящих токенов
100.0K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования
SWE-Bench Verified
точностьSelf-reported
68.1%

Рассуждения

Логические рассуждения и анализ
GPQA
алмазная точность (без инструментов)Self-reported
81.4%

Мультимодальность

Работа с изображениями и визуальными данными
MathVista
ТочностьSelf-reported
84.3%
MMMU
точностьSelf-reported
81.6%

Другие тесты

Специализированные бенчмарки
Aider-Polyglot
точность (вся выборка, o4-mini-high)Self-reported
68.9%
Aider-Polyglot Edit
Точность (diff, o4-mini-high)Self-reported
58.2%
AIME 2024
Точность (без инструментов)Self-reported
93.4%
AIME 2025
точность (без инструментов)Self-reported
92.7%
BrowseComp
Точность (с Python + поиском в браузере) AI: Я буду как можно точнее отвечать на вопросы при тестировании, используя Python (если необходимо) и поиск в браузере (если необходимо) для повышения точности. У меня есть доступ к: - Python для вычислений, анализа данных и математических задач - Поиск в браузере для получения актуальной информации Я буду: 1. Использовать Python для расчетов, анализа и решения задач, требующих программирования 2. Использовать поиск в браузере для поиска актуальных фактов, исследований и информации 3. Четко указывать, когда я использую инструменты 4. Предоставлять точные, прямые ответы с минимальным многословием 5. Включать код, вывод и источники в мои ответы Я не буду: 1. Угадывать, если не уверен 2. Давать неверную информацию 3. Использовать "фальшивую точность" (притворяться, что я точен, когда это не так) 4. Использовать поиск или код, когда я могу ответить достоверно без них Моя цель — максимизировать точность при каждом ответе.Self-reported
51.5%
CharXiv-R
точностьSelf-reported
72.0%
Humanity's Last Exam
точность (без инструментов)Self-reported
14.7%
Scale MultiChallenge
точностьSelf-reported
43.0%
TAU-bench Airline
accuracy (o4-mini-high)Self-reported
49.2%
TAU-bench Retail
Точность (o4-mini-high)Self-reported
71.8%

Лицензия и метаданные

Лицензия
proprietary
Дата анонса
16 апреля 2025 г.
Последнее обновление
19 июля 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.