Основные характеристики
Параметры
-
Контекст
-
Дата выпуска
17 декабря 2024 г.
Средний балл
82.5%
Временная шкала
Ключевые даты в истории модели
Анонс
17 декабря 2024 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.
Технические характеристики
Параметры
-
Токены обучения
-
Граница знаний
30 сентября 2023 г.
Семейство
-
Возможности
МультимодальностьZeroEval
Результаты бенчмарков
Показатели производительности модели на различных тестах и бенчмарках
Рассуждения
Логические рассуждения и анализ
GPQA
Diamond, точность Pass@1
AI: Уровень Алмаз, точность Pass@1 • Self-reported
Другие тесты
Специализированные бенчмарки
AIME 2024
Pass@1 точность
Это основная метрика, используемая для оценки моделей в математических задачах. Она относится к вероятности того, что модель решит задачу с первой попытки. В каждой попытке модели предоставляется задача, и она генерирует решение. Затем решение автоматически оценивается с использованием судейского скрипта, который проверяет, является ли ответ правильным. • Self-reported
Лицензия и метаданные
Лицензия
proprietary
Дата анонса
17 декабря 2024 г.
Последнее обновление
19 июля 2025 г.