xAI logo

Grok-4

Мультимодальная
xAI

Grok 4, анонсированная xAI летом 2025 года, представляет собой значительный скачок в возможностях ИИ и описывается как "самый умный ИИ в мире". Построенная на шестой версии базовой модели xAI, она использует в 100 раз больше вычислительных ресурсов для обучения, чем Grok 2, и в 10 раз больше вычислительных ресурсов для обучения с подкреплением, чем Grok 3. Модель достигает производительности уровня PhD во всех академических дисциплинах одновременно, показывая безупречные результаты в стандартизированных тестах, таких как SAT, и близкие к идеальным результаты в выпускных экзаменах, таких как GRE. В отличие от Grok 3, использование инструментов встроено в процесс обучения, а не полагается на обобщение. Обученная с использованием 200 000 GPU, Grok 4 превосходно справляется со сложными рассуждениями, решением математических задач и задачами программирования, хотя имеет признанные слабости в мультимодальных возможностях, которые решаются в следующей версии.

Основные характеристики

Параметры
-
Контекст
256.0K
Дата выпуска
9 июля 2025 г.
Средний балл
63.1%

Временная шкала

Ключевые даты в истории модели
Анонс
9 июля 2025 г.
Последнее обновление
19 июля 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
-
Токены обучения
-
Граница знаний
31 декабря 2024 г.
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$3.00
Выход (за 1М токенов)
$15.00
Макс. входящих токенов
256.0K
Макс. исходящих токенов
8.0K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Рассуждения

Логические рассуждения и анализ
GPQA
точностьSelf-reported
87.5%

Другие тесты

Специализированные бенчмарки
AIME 2025
точностьSelf-reported
91.7%
ARC-AGI v2
точностьSelf-reported
15.9%
HMMT25
точностьSelf-reported
90.0%
Humanity's Last Exam
точностьSelf-reported
40.0%
LiveCodeBench
точностьSelf-reported
79.0%
USAMO25
точностьSelf-reported
37.5%

Лицензия и метаданные

Лицензия
proprietary
Дата анонса
9 июля 2025 г.
Последнее обновление
19 июля 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.