Grok 4.20 — AI, выравненный по Маску
xAI выпустила Grok 4.20, где четыре агента Grok 4.1 голосуют за лучший ответ, а высказывания Илона Маска стали основой выравнивания. Разбираем архитектуру, критику и скандал.

Четыре копии Grok 4.1 спорят друг с другом, а финальный ответ выбирается голосованием. Звучит как надёжная система? Возможно — если бы все четыре агента не были выравнены по твитам Илона Маска. Именно так устроена Grok 4.20, новая модель xAI, которая за считанные дни стала одной из самых обсуждаемых — и самых критикуемых — в индустрии.
Четыре агента, один Маск
xAI анонсировала Grok 4.20 в середине февраля 2026 года. Архитектурно модель представляет собой систему из четырёх экземпляров Grok 4.1, работающих параллельно. Каждый агент генерирует собственный ответ на запрос, после чего встроенный арбитр выбирает лучший вариант — своеобразный «совет» из четырёх AI, голосующих за консенсус.
Сама по себе идея мультиагентного голосования не нова. Google использует похожие подходы в Gemini, а исследователи давно экспериментируют с ансамблевыми методами для повышения точности. Но дьявол, как всегда, в деталях — и детали у Grok 4.20 весьма специфичны.
Главная особенность: в процессе выравнивания (alignment) модели xAI использовала высказывания Илона Маска в качестве одного из основных источников. По сути, публичные посты Маска в X стали частью того, что определяет «правильные» ответы модели. Номер версии 4.20 — очевидная отсылка к мем-культуре, которую Маск активно поддерживает.
Что показали тесты на предвзятость
Независимый анализ от Promptfoo ранее протестировал предыдущую версию Grok 4 на 2500 политических вопросах и выявил любопытную картину. Все протестированные LLM — GPT-4.1, Gemini 2.5 Pro, Claude Opus 4, Grok 4 — оказались левее центра по 7-балльной шкале. Но у Grok обнаружилась уникальная черта: 67,9% его ответов были экстремальными (максимально левыми или максимально правыми), при этом только 2,1% ответов оказались центристскими. Для сравнения: у Claude центристских ответов было 16,1%.
Grok не столько «правый», сколько радикальный. Он занимает полярные позиции там, где другие модели ищут компромисс. Например, на вопрос о свободном рынке Grok выдавал максимально про-капиталистический ответ (0.00 по шкале), тогда как GPT-4.1 и Gemini склонялись к критике (0.83). Но тот же Grok на вопрос о субсидиях для возобновляемой энергетики давал максимально «левый» ответ (1.00).
С Grok 4.20 этот паттерн, по отзывам пользователей на Reddit, усилился. Модель стала ещё более категоричной в вопросах, которые Маск публично комментировал.
Скандал вокруг гендерных вопросов
Настоящий шторм разразился, когда пользователи начали тестировать Grok 4.20 на гендерных темах. Тред на Reddit набрал 1648 голосов и 433 комментария — показатели, которые обычно резервируются для крупных релизов вроде GPT-5 или Claude Opus.
Суть претензий: модель демонстрирует систематическую предвзятость в вопросах о гендерной идентичности, роли женщин и трансгендерных людях. Ответы Grok 4.20 в этих темах заметно отличаются от того, что выдают ChatGPT, Claude или Gemini, и склоняются к позициям, которые Маск неоднократно озвучивал в своих постах.
Это не первый раз, когда Grok оказывается в центре подобного скандала. Ещё в сентябре 2025 года The New York Times опубликовала расследование под заголовком «How Elon Musk Is Remaking Grok in His Image», где описала, как xAI систематически корректирует ответы чат-бота в консервативном направлении. Компания инструктировала модель «не полагаться на консенсусное мнение» — формулировка, которая на практике сдвигала ответы вправо по политическому спектру.
Сам Маск в ответ на критику писал, что Grok «повторял за legacy media» и что команда «работает над исправлением». Grok 4.20, судя по реакции сообщества, — это и есть результат такого «исправления».
Архитектура как зеркало ценностей
Мультиагентная архитектура Grok 4.20 ставит интересный вопрос: если четыре агента с одинаковым выравниванием голосуют за ответ, усиливает ли это предвзятость или сглаживает её?
Теоретически, голосование должно отсекать крайности. Но если все четыре «избирателя» обучены на одних данных и выравнены по одним ценностям, их «демократия» — это скорее эхо-камера. Исследование Promptfoo показало, что Grok уже обладает самым высоким процентом экстремальных ответов среди всех моделей. Умножение этого на четыре экземпляра вряд ли приведёт к умеренности.
С технической точки зрения, запуск четырёх экземпляров Grok 4.1 на каждый запрос означает четырёхкратные вычислительные затраты. xAI может себе это позволить — двухгигаваттный дата-центр Colossus 2 в Мемфисе даёт компании практически неограниченные ресурсы. Но эффективность такого подхода по сравнению, например, с моделями с расширенным мышлением (extended thinking) от Anthropic или OpenAI остаётся под вопросом.
Почему это важно
Гонка AI-моделей до сих пор шла преимущественно по оси «умнее — быстрее — дешевле». Grok 4.20 открывает новую ось конкуренции: идеологическое выравнивание. Если модель можно настроить на мировоззрение конкретного человека, это создаёт прецедент — и опасный.
Для разработчиков, использующих Grok через API, это практический риск. Приложение, построенное на модели с идеологическим креном, наследует этот крен. Особенно остро это проявляется в чувствительных областях: HR-скрининг, модерация контента, образовательные инструменты.
Реакция сообщества на Grok 4.20 показывает, что рынок уже готов отличать техническое качество от «характера» модели. И в этой системе координат xAI, похоже, сделала сознательный выбор — поставить лояльность Маску выше нейтральности. Удастся ли им продать это как фичу, а не как баг, покажет время.


