Anthropic logo

Claude Opus 4.1

Мультимодальная
Anthropic

Claude Opus 4.1 — это гибридная модель рассуждений, которая расширяет границы возможностей в области программирования и AI-агентов, оснащенная контекстным окном в 200K токенов. Она обеспечивает превосходную производительность и точность для реальных задач программирования и агентных приложений, справляясь со сложными многоэтапными проблемами с тщательностью и вниманием к деталям. Благодаря расширенным возможностям мышления модель предлагает мгновенные ответы или развернутые пошаговые рассуждения, видимые через удобные для пользователя сводки. Она продвигает современные достижения в производительности программирования до 74,5% на SWE-bench Verified, превосходно справляется с агентным поиском и исследованиями, а также создает контент человеческого качества с исключительными способностями к письму. Модель поддерживает 32K выходных токенов и адаптируется к конкретным стилям программирования, обеспечивая исключительное качество для масштабных проектов генерации и рефакторинга.

Основные характеристики

Параметры
-
Контекст
200.0K
Дата выпуска
5 августа 2025 г.
Средний балл
72.7%

Временная шкала

Ключевые даты в истории модели
Анонс / Последнее обновление
5 августа 2025 г.
Сегодня
31 августа 2025 г.

Технические характеристики

Параметры
-
Токены обучения
-
Граница знаний
-
Семейство
-
Возможности
МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)
$15.00
Выход (за 1М токенов)
$75.00
Макс. входящих токенов
200.0K
Макс. исходящих токенов
32.0K
Поддерживаемые возможности
Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования
SWE-Bench Verified
Без расширенного обдумывания. Простая структура с использованием инструмента bash и инструмента редактирования файлов через замену строк. Результаты представлены из полных 500 задач.Self-reported
74.5%

Рассуждения

Логические рассуждения и анализ
GPQA
Diamond: Расширенное мышление (до 64 тысяч токенов)Self-reported
80.9%

Другие тесты

Специализированные бенчмарки
Terminal-bench
Без расширенного мышления. Terminus 1 усреднен по 5 испытаниям.Self-reported
43.3%
TAU-bench Retail
Расширенное размышление с использованием инструментов (до 64K токенов, дополнение к промпту, увеличение максимального количества шагов с 30 до 100).Self-reported
82.4%
TAU-bench Airline
Расширенное размышление с использованием инструментов (до 64K токенов, дополнение к запросу, увеличенное максимальное количество шагов с 30 до 100).Self-reported
56.0%
MMMLU
Расширенное размышление (до 64K токенов). Среднее значение по 14 неанглийским языкам.Self-reported
89.5%
MMMU (validation)
Расширенное мышление (до 64K токенов) AI: GPT-4: I want you to solve the hardest, most complex question in this document. If there are multiple questions, pick the hardest one. Let's explore this step-by-step. First, I need to read through the document to identify all questions and assess their difficulty. Then I'll select the most challenging one and work through it thoroughly. For complex problems, I'll: 1. Break down the problem into smaller parts 2. Identify key concepts and formulas needed 3. Work methodically through each step 4. Double-check my work 5. Ensure my final answer is clearly explained Let me begin by examining the document... [Model continues thinking through the problem in detail, exploring multiple approaches, checking for errors, and refining the solution over many steps]Self-reported
77.1%
AIME 2025
Расширенное размышление (до 64K токенов). AIME 2025 с использованием выборки по ядру с параметром top_p равным 0.95.Self-reported
78.0%

Лицензия и метаданные

Лицензия
proprietary
Дата анонса
5 августа 2025 г.
Последнее обновление
5 августа 2025 г.

Похожие модели

Все модели

Рекомендации основаны на схожести характеристик: организация-разработчик, мультимодальность, размер параметров и производительность в бенчмарках. Выберите модель для сравнения или перейдите к полному каталогу для просмотра всех доступных моделей ИИ.