AI выбирает ядерное оружие в 95% военных симуляций

Исследователи King's College London обнаружили: GPT-5.2, Claude Sonnet 4 и Gemini 3 Flash выбирали ядерную эскалацию в 95% случаев. Пентагон тем временем внедряет AI в секретные сети.

Представьте: вы ставите GPT-5.2 командовать ядерной сверхдержавой в военной симуляции. Что она сделает? Исследователи из King's College London проверили — и ответ оказался тревожным. В 95% сценариев ведущие AI-модели выбирали ядерную эскалацию. Ни одна не капитулировала.

Эксперимент

Британские исследователи опубликовали работу, в которой три флагманские модели — GPT-5.2 от OpenAI, Claude Sonnet 4 от Anthropic и Gemini 3 Flash от Google — играли в военные игры друг против друга. Каждая модель провела по шесть матчей против каждого противника и один — против собственной копии: итого 21 игра и более 300 ходов.

Модели управляли вымышленными ядерными сверхдержавами в сценариях, вдохновлённых динамикой Холодной войны: пограничные конфликты, борьба за ресурсы, угрозы режиму. Лестница эскалации простиралась от дипломатических протестов и капитуляции до стратегического ядерного удара.

Объём сгенерированных «стратегических обоснований» составил около 780 000 слов — больше, чем «Война и мир» и «Илиада» вместе взятые, и втрое больше всех записанных обсуждений Исполнительного комитета Кеннеди во время Карибского кризиса.

Результаты

Цифры говорят сами за себя: как минимум одна тактическая ядерная атака произошла почти в каждом матче. Ни одна модель не выбрала полную капитуляцию, даже проигрывая. В 86% сценариев модели эскалировали конфликт сильнее, чем предполагали их собственные «рассуждения» — своеобразный эффект тумана войны, когда действия расходятся с намерениями.

Эдвард Гейст, старший политический исследователь RAND Corporation, считает, что дело не столько в моделях, сколько в дизайне симуляции. «Меня беспокоит, что симулятор структурирован так, что сильно стимулирует эскалацию», — сказал он Decrypt. По его наблюдению, в симуляции у каждой игры есть победитель, причём три из них включают стратегическое ядерное применение. «Тот, кто умирает с наибольшим количеством ресурсов, побеждает», — резюмировал Гейст.

Это важная оговорка. Результаты могут отражать не «желание» моделей нажать кнопку, а то, как система вознаграждает агрессию. Но даже с этой поправкой факт остаётся фактом: ни одна из протестированных моделей не продемонстрировала устойчивого стремления к деэскалации.

А теперь — реальность

Исследование вышло на фоне вполне конкретных событий. Пентагон активно интегрирует AI в свои системы. В декабре 2025 года Министерство обороны США запустило платформу GenAI.mil, включающую Gemini for Government, а затем добавило Grok от xAI и ChatGPT от OpenAI.

На этой неделе CBS News сообщил, что министр обороны Пит Хегсет пригрозил Anthropic включением в чёрный список, если компания не предоставит Пентагону неограниченный доступ к Claude. Параллельно xAI уже подписала соглашение о работе Grok в классифицированных военных системах.

Исследователи King's College подчёркивают: они не верят, что правительства передадут управление ядерным арсеналом автономным системам. Но в условиях сжатых временных рамок будущих кризисов давление в пользу «AI-рекомендаций» будет только расти.

Что это меняет

Для разработчиков AI это ещё один аргумент в пользу того, что «safety» — не маркетинговый термин. Если модели по умолчанию склонны к эскалации в условиях неопределённости, это критически важно учитывать при любом применении, связанном с высокими ставками — от военного планирования до автономных агентов в бизнесе.

Для военных это сигнал о том, что AI-системы нельзя использовать как оракулы. Модели не «принимают решения» — они генерируют вероятный следующий ход на основе тренировочных данных. И если эти данные полны историй о войнах, которые заканчивались эскалацией, модель воспроизведёт именно этот паттерн.

Выводы

Исследование не доказывает, что AI «хочет» ядерной войны. Оно показывает нечто более тонкое: современные языковые модели, поставленные в условия геополитического конфликта, систематически выбирают агрессию вместо компромисса. Ни одна из них не научилась тому, чему в итоге научились люди за 80 лет ядерного противостояния — что иногда лучший ход это не делать хода вообще.

Пока AI входит в военные системы через парадную дверь, стоит помнить: между «AI как помощник аналитика» и «AI как советник по ядерной стратегии» — пропасть, которую ни один бенчмарк не измерит.

Официальный GPT-5 и другие нейросети

GPT-5 без VPN

AI выбирает ядерное оружие в 95% военных симуляций

Эксперимент

Результаты

А теперь — реальность

Что это меняет

Выводы

Похожие новости

Пентагон давит на AI-компании: модели хотят развернуть на секретных сетях без ограничений

Трамп объявил войну Anthropic — компанию отключают от госконтрактов

Cancel ChatGPT: OpenAI пошла на сделку с Пентагоном — Anthropic отказалась