GPT-5 без VPN

Aijora.ru — без ограничений

Попробовать бесплатно
Все новости
deepmindreinforcement-learningстартапысуперинтеллектagi

Создатель AlphaGo покинул DeepMind ради собственного стартапа

David Silver, архитектор AlphaGo, AlphaZero и MuZero, ушёл из Google DeepMind и основал Ineffable Intelligence — стартап для создания суперинтеллекта через reinforcement learning.

Влад МакаровВлад Макаровпроверил и опубликовал
7 мин чтения
Создатель AlphaGo покинул DeepMind ради собственного стартапа

David Silver — человек, благодаря которому компьютер впервые обыграл чемпиона мира по го — больше не работает в Google DeepMind. После 14 лет в компании один из самых влиятельных исследователей reinforcement learning запустил собственный стартап Ineffable Intelligence в Лондоне.

Почему это важно

Silver не просто уходит «попробовать что-то новое». Он публично заявляет, что большие языковые модели — тупиковый путь к AGI. В мире, где все крупнейшие лаборатории вкладывают миллиарды в масштабирование трансформеров, это прозвучало как манифест.

«Мы хотим выйти за пределы человеческого знания, — говорил Silver в подкасте DeepMind в апреле прошлого года. — Для этого нужен другой подход. Нужно, чтобы AI сам открывал то, чего люди ещё не знают».

Его новый стартап будет строить «бесконечно обучающийся суперинтеллект, который самостоятельно открывает основы всего знания». Звучит амбициозно, но за этими словами стоит конкретная методология — reinforcement learning, на которой Silver построил карьеру.

Что он создал в DeepMind

Silver был одним из первых сотрудников DeepMind, когда компанию основали в 2010 году. Он знал Демиса Хассабиса ещё по университету. Его послужной список впечатляет:

  • AlphaGo (2016) — первая программа, обыгравшая чемпиона мира по го
  • AlphaZero (2017) — система, освоившая шахматы, сёги и го на сверхчеловеческом уровне
  • MuZero (2020) — алгоритм, который учится играть в игры, не зная правил
  • AlphaStar (2019) — AI, победивший лучших игроков в StarCraft II
  • AlphaProof (2024) — система для решения задач Международной математической олимпиады

Silver также входит в число авторов оригинальной статьи о Gemini — флагманской модели Google.

Эра опыта против эры данных

Главный аргумент Silver против LLM — их зависимость от человеческого знания. Языковые модели обучаются на текстах, написанных людьми, и оцениваются людьми на этапе RLHF. Но человеческая интуиция может быть ошибочной или недальновидной.

В матче AlphaGo против Ли Седоля в 2016 году был показательный момент. 37-й ход во второй партии выглядел настолько странным, что все эксперты решили — это ошибка. Но именно этот ход оказался ключом к победе.

Если бы человеческие оценщики давали обратную связь на такие ходы в процессе RLHF, они бы поставили им «палец вниз». Вот почему Silver считает, что для суперинтеллекта AI должен учиться с нуля, работая от первых принципов, а не опираясь на человеческие предпочтения.

Silver называет это «эрой опыта» — следующим этапом развития AI после эры данных.

Гонка за суперинтеллектом

Silver не первый, кто покидает крупную лабораторию ради стартапа с амбициями построить суперинтеллект. Илья Суцкевер, бывший главный научный сотрудник OpenAI, в 2024 году основал Safe Superintelligence (SSI), которая уже привлекла $3 миллиарда и оценивается в $30 миллиардов.

Некоторые коллеги Silver по проектам AlphaGo, AlphaZero и MuZero недавно основали Reflection AI с похожими целями. Meta реорганизовала своё AI-подразделение в «Superintelligence Labs» под руководством бывшего CEO Scale AI Александра Ванга.

Ineffable Intelligence была зарегистрирована в Великобритании в ноябре 2025 года. Silver стал директором компании 16 января 2026 года. Сейчас стартап активно рекрутирует AI-исследователей и ищет венчурное финансирование.

Что дальше

Google DeepMind подтвердила уход Silver, назвав его вклад «неоценимым». Silver был в саббатикале последние месяцы и так и не вернулся к работе в DeepMind официально. Он сохраняет позицию профессора в University College London.

На личном сайте Silver уже указал контакты Ineffable Intelligence, хотя до сих пор написано, что он «возглавляет команду reinforcement learning» в DeepMind.

Для индустрии уход Silver — сигнал о том, что не все верят в бесконечное масштабирование трансформеров. Если создатель AlphaGo считает, что путь к AGI лежит через reinforcement learning, возможно, стоит присмотреться к этому направлению внимательнее.

Похожие новости

Листайте вниз

для загрузки следующей статьи