GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
googlegeminiрелизбенчмарки

Gemini 3.1 Pro: вдвое умнее предшественника

Google выпустила Gemini 3.1 Pro с удвоенной производительностью на ARC-AGI-2 и рекордами в кодинге. Разбираем бенчмарки, цены и доступ через API.

Влад МакаровВлад Макаровпроверил и опубликовал
6 мин чтения
Gemini 3.1 Pro: вдвое умнее предшественника

77,1% на ARC-AGI-2 — больше чем вдвое по сравнению с 31,1% у Gemini 3 Pro. Google не просто обновила модель, а фактически переписала правила игры в абстрактном мышлении. Gemini 3.1 Pro, анонсированная 19 февраля 2026 года, уже доступна разработчикам и пользователям.

Что нового

Главное изменение — то самое «улучшенное ядро интеллекта», которое неделей ранее дебютировало в Gemini 3 Deep Think. Теперь оно доступно в базовой модели без необходимости переключаться в тяжёлый режим рассуждений. На практике это означает, что 3.1 Pro умеет «притормозить и подумать» над сложной задачей — нативный параметр Dynamic Thinking включён по умолчанию. Латентность и стоимость при этом остаются ниже, чем у Deep Think.

Второе направление прорыва — кодинг и агентные задачи. На LiveCodeBench Pro модель набрала Elo 2 887, обойдя и предшественника (2 439), и GPT-5.2 (2 393). На BrowseComp — бенчмарке агентного поиска — результат вырос с 59,2% до 85,9%, скачок почти на 27 пунктов. А на APEX-Agents, тесте агентных workflow, производительность почти удвоилась.

Бенчмарки

БенчмаркGemini 3 ProGemini 3.1 ProИзменение
ARC-AGI-231,1%77,1%+148%
LiveCodeBench Pro (Elo)2 4392 887+448
BrowseComp59,2%85,9%+26,7 п.п.
SWE-Bench Pro54,2%
Humanity's Last Exam37,5%44,4%+6,9 п.п.
HLE (с инструментами)51,4%
MCP-Atlas69,2%
MMMU Pro81,0%80,5%-0,5 п.п.

Любопытная деталь: на мультимодальном MMMU Pro предшественник оказался чуть лучше — 81,0% против 80,5%. Это не регрессия в привычном смысле, скорее естественный разброс при переобучении. Но факт показательный: даже у самых сильных моделей прогресс не бывает равномерным по всем направлениям.

Для разработчиков

Модель доступна под идентификатором gemini-3.1-pro-preview через Gemini API, Google AI Studio, Gemini CLI, платформу Antigravity и Android Studio. Корпоративные пользователи получают доступ через Vertex AI и Gemini Enterprise.

Контекстное окно осталось на уровне 1 миллиона токенов на входе с 64K на выходе. Цены совпадают с тарифами Gemini 3 Pro — вывод обходится в $15 за миллион токенов.

Обычные пользователи уже видят 3.1 Pro в приложении Gemini и NotebookLM (для подписчиков AI Pro и Ultra).

Что это значит

Google последовательно сокращает разрыв между «умным, но дорогим» режимом Deep Think и базовой моделью. Для разработчиков агентных систем это особенно важно: BrowseComp 85,9% и MCP-Atlas 69,2% говорят о том, что Gemini 3.1 Pro уже способна автономно работать с инструментами на уровне, который ещё полгода назад считался фантастикой.

При этом Google позиционирует модель не как замену Deep Think, а как улучшенный фундамент. Для задач, требующих максимальной глубины рассуждений, Deep Think по-прежнему остаётся предпочтительным вариантом. А 3.1 Pro — это баланс между интеллектом и скоростью для повседневных сложных задач.

Похожие новости

Листайте вниз

для загрузки следующей статьи