Claude Opus 4.1

Name: Claude Opus 4.1
Author: Anthropic

Мультимодальная

Anthropic

Claude Opus 4.1 — это гибридная модель рассуждений, которая расширяет границы возможностей в области программирования и AI-агентов, оснащенная контекстным окном в 200K токенов. Она обеспечивает превосходную производительность и точность для реальных задач программирования и агентных приложений, справляясь со сложными многоэтапными проблемами с тщательностью и вниманием к деталям. Благодаря расширенным возможностям мышления модель предлагает мгновенные ответы или развернутые пошаговые рассуждения, видимые через удобные для пользователя сводки. Она продвигает современные достижения в производительности программирования до 74,5% на SWE-bench Verified, превосходно справляется с агентным поиском и исследованиями, а также создает контент человеческого качества с исключительными способностями к письму. Модель поддерживает 32K выходных токенов и адаптируется к конкретным стилям программирования, обеспечивая исключительное качество для масштабных проектов генерации и рефакторинга.

Основные характеристики

Параметры

Контекст

200.0K

Дата выпуска

5 августа 2025 г.

Средний балл

72.7%

Блог с результатами

Временная шкала

Ключевые даты в истории модели

Анонс / Последнее обновление

5 августа 2025 г.

Сегодня

22 июня 2026 г.

Технические характеристики

Параметры

Токены обучения

Граница знаний

Семейство

Возможности

МультимодальностьZeroEval

Ценообразование и доступность

Вход (за 1М токенов)

$15.00

Выход (за 1М токенов)

$75.00

Макс. входящих токенов

200.0K

Макс. исходящих токенов

32.0K

Поддерживаемые возможности

Function CallingStructured OutputCode ExecutionWeb SearchBatch InferenceFine-tuning

Результаты бенчмарков

Показатели производительности модели на различных тестах и бенчмарках

Программирование

Тесты на навыки программирования

SWE-Bench Verified

Без расширенного обдумывания. Простая структура с использованием инструмента bash и инструмента редактирования файлов через замену строк. Результаты представлены из полных 500 задач. • Self-reported

74.5%

Рассуждения

Логические рассуждения и анализ

GPQA

Diamond: Расширенное мышление (до 64 тысяч токенов) • Self-reported

80.9%

Другие тесты

Специализированные бенчмарки

Terminal-bench

Без расширенного мышления. Terminus 1 усреднен по 5 испытаниям. • Self-reported

43.3%

TAU-bench Retail

Расширенное размышление с использованием инструментов (до 64K токенов, дополнение к промпту, увеличение максимального количества шагов с 30 до 100). • Self-reported

82.4%

TAU-bench Airline

Расширенное размышление с использованием инструментов (до 64K токенов, дополнение к запросу, увеличенное максимальное количество шагов с 30 до 100). • Self-reported

56.0%

MMMLU

Расширенное размышление (до 64K токенов). Среднее значение по 14 неанглийским языкам. • Self-reported

89.5%

MMMU (validation)

Расширенное мышление (до 64K токенов) AI: GPT-4: I want you to solve the hardest, most complex question in this document. If there are multiple questions, pick the hardest one. Let's explore this step-by-step. First, I need to read through the document to identify all questions and assess their difficulty. Then I'll select the most challenging one and work through it thoroughly. For complex problems, I'll: 1. Break down the problem into smaller parts 2. Identify key concepts and formulas needed 3. Work methodically through each step 4. Double-check my work 5. Ensure my final answer is clearly explained Let me begin by examining the document... [Model continues thinking through the problem in detail, exploring multiple approaches, checking for errors, and refining the solution over many steps] • Self-reported

77.1%

AIME 2025

Расширенное размышление (до 64K токенов). AIME 2025 с использованием выборки по ядру с параметром top_p равным 0.95. • Self-reported

78.0%

Лицензия и метаданные

Лицензия

proprietary

Дата анонса

5 августа 2025 г.

Последнее обновление

5 августа 2025 г.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

Claude Opus 4.1

Основные характеристики

Временная шкала

Технические характеристики

Ценообразование и доступность

Результаты бенчмарков

Программирование

Рассуждения

Другие тесты

Лицензия и метаданные

Похожие модели

Claude Sonnet 4.6

Claude 3.5 Sonnet

Claude 3.5 Sonnet

Claude 3 Opus

Claude Sonnet 4.5

Claude Haiku 4.5

Claude Opus 4.5

Claude Sonnet 4