Claude Opus 4.7 вышел: 64.3% на SWE-Bench Pro и 3x разрешение зрения
Anthropic выпустила Claude Opus 4.7 — модель стала лидером на SWE-Bench Pro (64.3%) и SWE-Bench Verified (87.6%), обогнав GPT-5.4 и Gemini 3.1 Pro. Цена — $5/$25 за миллион токенов.

64.3 процента. Столько Claude Opus 4.7 выбил на SWE-Bench Pro — бенчмарке, где модель должна закрыть реальный GitHub-тикет, а не решить синтетическую задачу. Это не просто рекорд: это +10.9 процентных пункта к предыдущему Opus 4.6 за один релиз. Для сравнения — GPT-5.4 выдаёт 57.7%.
Что выпустили
Anthropic представила Opus 4.7 16 апреля 2026 года. Модель доступна во всех тарифах Claude (Pro, Max, Team, Enterprise), через API, а также в Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Внутренний кодовый номер — Fennec.
Цена — $5 за миллион входных токенов и $25 за миллион выходных. Это тот же прайс, что у Opus 4.6. Никакого повышения за новые возможности, что редкость для флагманских обновлений.
Где выросли цифры
Главное обновление — кодинг и агентные сценарии. Опубликованные результаты показывают системный скачок по всем основным бенчмаркам этой категории.
| Бенчмарк | Opus 4.6 | Opus 4.7 | Прирост |
|---|---|---|---|
| SWE-Bench Pro | 53.4% | 64.3% | +10.9 |
| SWE-Bench Verified | 80.8% | 87.6% | +6.8 |
| CursorBench | 58% | 70% | +12 |
На SWE-Bench Pro Opus 4.7 опережает GPT-5.4 (57.7%) и Gemini 3.1 Pro. На SWE-Bench Verified — устанавливает отраслевой рекорд среди коммерчески доступных моделей.
Отдельно Anthropic подчёркивает +14% к качеству многошагового агентного ризонинга при трёхкратном снижении ошибок в вызовах инструментов. Для компаний, которые строят на Claude собственных агентов, это важнее голого SWE-Bench — именно «уронилось посреди цепочки» было главной проблемой Opus 4.6.
Что изменилось в модели
Помимо кодинга, в Opus 4.7 появилось несколько системных улучшений, которые меняют её применимость.
Разрешение картинок выросло в три раза — до 3.75 мегапикселя. Это значит, что модель наконец читает скриншоты с плотным UI, финансовые дашборды и архитектурные схемы без «расплывания» на мелком тексте. Для рабочих сценариев — чтение PDF с графиками, анализ интерфейсов, проверка кода по скриншоту IDE — это критический сдвиг.
Появился новый контрол — «reasoning effort». Разработчик может явно задать, сколько модель «думает» перед ответом: low для быстрых задач, medium по умолчанию, high для сложного анализа. Это копия концепции OpenAI reasoning_effort и признание того, что одна настройка температуры уже не решает задачу баланса между скоростью и качеством.
Multi-agent coordination — модель теперь умеет координировать параллельные суб-агенты в длинных workflow. На практике это значит, что Claude может запустить подзадачи в фоне, собрать результаты и продолжить основную цепочку — без обрыва контекста на середине рабочего процесса, который длится часами.
Почему это важно
Скачок на 10.9 пункта за один релиз — аномалия. Между GPT-4 и GPT-4 Turbo было меньше. Между Claude 3 Opus и 3.5 Sonnet — тоже меньше. Anthropic не объясняет архитектурные изменения, но размер прироста говорит о том, что это не тюнинг, а переработка обучающего стека.
Интересен и контекст релиза. Decrypt, тестировавший модель первым, называет её «token-eating machine» — на сложных задачах Opus 4.7 тратит заметно больше выходных токенов, чем 4.6. Качество растёт, но счёт тоже. Для разработчиков, которые считают себестоимость на миллион запросов, это значит необходимость перемерить экономику перед миграцией.
Что это значит для рынка
Opus 4.7 выходит в момент, когда Anthropic разгоняет продуктовую машину. По данным The Information, годовая выручка компании ушла с $9 млрд на $30 млрд run-rate за квартал, а в новом инвестраунде обсуждается оценка до $800 млрд. Новый Opus — коммерческий флагман, который должен оправдать эти цифры.
Фронт конкуренции сместился. Год назад главным полем битвы был MMLU — общие знания. Сегодня лидерство на рынке определяется SWE-Bench Pro и агентными задачами: кто первым закроет больше реальных тикетов, тот получит корпоративных клиентов. Anthropic выиграла этот раунд на 6.6 пункта у OpenAI.
Для разработчиков практический итог простой. Если вы пишете агента для кодинга или используете Claude как основного копилота — обновляйтесь. Прирост в 14% к multi-step агентной работе и 3x к точности вызовов инструментов окупает цену без расчётов. Если вы на API платите за Opus 4.6 и цепочки ломаются в середине — это ваш релиз.

