GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
anthropicclaudesonnetрелизкодингконтекст

Claude Sonnet 4.6 — Opus для всех?

Anthropic выпустила Sonnet 4.6 с улучшениями в кодинге, компьютерном использовании и контекстом 1М токенов в бета. Сообщество спорит: зачем теперь Opus?

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
Claude Sonnet 4.6 — Opus для всех?

97% возможностей Opus по цене в пять раз ниже. Именно этой цифрой разработчики описывают Claude Sonnet 4.6 — новую модель Anthropic, которая вышла 17 февраля и моментально стала дефолтом для всех пользователей Claude, включая бесплатный тариф. На Reddit пост о релизе набрал 1052 голоса и 253 комментария, а главный вопрос в каждом втором треде один: зачем теперь платить за Opus?

Что изменилось

Sonnet 4.6 — это не инкрементальное обновление, а полноценная смена поколения. Anthropic заявляет об улучшениях сразу по шести направлениям: кодинг, компьютерное использование, работа с длинным контекстом, агентное планирование, аналитика и дизайн. Разработчики с ранним доступом предпочитали Sonnet 4.6 предыдущей версии в 70% случаев при использовании через Claude Code. Более того, 59% предпочли его даже Claude Opus 4.5 — флагману ноября 2025 года.

Контекстное окно теперь составляет 1 миллион токенов в бета-режиме. Это примерно 3000 страниц текста или целый репозиторий среднего размера. Раньше таким контекстом могли похвастаться только Gemini и Opus, теперь Sonnet догоняет.

Отдельно стоит отметить компьютерное использование (computer use). Sonnet 4.6 показывает результаты, которые Anthropic называет «human-level» — модель способна ориентироваться в сложных таблицах, заполнять многошаговые веб-формы и выполнять последовательности действий на рабочем столе. Компания Pace сообщила о 94% точности на их страховом бенчмарке, что делает Sonnet 4.6 лучшей моделью, которую они тестировали для автоматизации офисных задач.

Бенчмарки: разрыв с Opus тает

Цифры говорят сами за себя. На SWE-bench Verified — стандартном тесте для оценки кодинга — Sonnet 4.6 набрал 79,6% против 80,8% у Opus 4.6. Разница в 1,2 процентных пункта — в пределах погрешности для большинства практических задач.

БенчмаркSonnet 4.6Opus 4.6Разница
SWE-bench Verified79,6%80,8%-1,2 п.п.
OSWorld-Verified72,5%72,7%-0,2 п.п.
GPQA Diamond~74%~91%-17 п.п.

На OSWorld — бенчмарке для компьютерного использования — модели практически идентичны: 72,5% у Sonnet против 72,7% у Opus. Но есть и область, где Opus по-прежнему далеко впереди: научное мышление. На GPQA Diamond разрыв составляет около 17 процентных пунктов — это самое большое различие между моделями.

Цена и доступность

Sonnet 4.6 сохраняет ценообразование предыдущего Sonnet: $3 за миллион входных токенов и $15 за миллион выходных. Opus 4.6 стоит $5/$25 — в 1,7 раза дороже.

Но есть нюанс. Пользователь на Reddit обратил внимание, что Sonnet 4.6 генерирует значительно больше токенов, чем его предшественник. На бенчмарке GDPval-AA (офисные задачи) Sonnet 4.6 потребил 280 миллионов токенов — против 160 миллионов у Opus 4.6. То есть Sonnet обогнал Opus по качеству на этом бенчмарке, но потратил на 75% больше токенов. При пересчёте на доллары выигрыш в цене частично нивелируется.

Модель доступна через API (claude-sonnet-4-6-20260217), на claude.ai, в Claude Code, Claude Cowork и на всех основных облачных платформах (AWS Bedrock, Google Cloud Vertex AI, Azure).

Что говорит сообщество

Реакция разработчиков в целом восторженная — но с оговорками. На Reddit отмечают, что Sonnet 4.6 «чувствуется как Opus для повседневных задач», но при этом иногда уходит в излишнее «обдумывание», тратя больше токенов, чем нужно.

Databricks сообщила, что Sonnet 4.6 сравнялся с Opus 4.6 на их внутренних тестах анализа корпоративных документов. Replit назвала соотношение производительности к стоимости «экстраординарным». GitHub отметил, что модель отлично справляется со сложными исправлениями кода в крупных кодовых базах, а Rakuten похвалила качество iOS-кода.

Сравнительный анализ от NxCode предлагает простую эвристику: Opus стоит использовать для аудита безопасности, мультиагентных систем, научных задач и обработки очень большого контекста (более 200K токенов). Для всего остального — Sonnet 4.6.

Кому подойдёт

Sonnet 4.6 — это модель для разработчиков, которые строят продукты. Не для исследователей, доказывающих теоремы, и не для систем, где каждый процент точности критичен. А для тех, кто пишет код, автоматизирует рабочие процессы, строит агентов и хочет получать результат уровня Opus без его ценника.

Для Anthropic это тоже стратегический ход. Сделав модель такого уровня дефолтом для бесплатных пользователей, компания прямо конкурирует с GPT-5.2 и Gemini 3 Pro на массовом рынке. И судя по первым реакциям, конкурирует успешно.

Похожие новости

Листайте вниз

для загрузки следующей статьи