Любитель решил 60-летнюю задачу Эрдёша через GPT-5.4 Pro
23-летний Liam Price без математического образования закрыл проблему Эрдёша 1196. ChatGPT Pro нашёл подход с цепями Маркова и весами фон Мангольдта, который эксперты годами не видели.

23-летний программист Liam Price, у которого нет ни PhD по математике, ни даже специализированного бакалавриата, закрыл проблему Эрдёша №1196 — конкретный асимптотический вопрос про примитивные множества целых чисел, открытый с 1960-х. Закрыл не за вечер: он несколько месяцев водил GPT-5.4 Pro вокруг задачи, пробовал переформулировки, проверял шаги вручную. На выходе получился аккуратный двухстраничный аргумент. Тома Блум, который ведёт каталог проблем Эрдёша, отметил статус задачи как «решена». Джаред Дукер Лихтман, ведущий человек-эксперт в этой области, написал в форумной ветке, что доказательство выглядит «как из Книги» — это отсылка к легендарной фразе самого Эрдёша об идеальных доказательствах.
Что именно было решено
Примитивное множество — это множество целых чисел больше единицы, в котором ни один элемент не делит другой. Простые числа — простейший пример. Множества чисел ровно с k простыми делителями — тоже. Эта область сидит на границе элементарной теории чисел и аналитической: формулировки выглядят простыми, а доказательства бывают тонкими.
Конкретно проблема №1196 спрашивала про асимптотическое поведение «суммы Эрдёша» по примитивному множеству A, обрезанной по большим числам. Эрдёш в своё время доказал, что вся эта сумма ограничена константой; вопрос про её хвост, обрезанный снизу по x, оставался открытым. GPT-5.4 Pro по подсказкам Прайса показал, что для любого примитивного множества A:
$$\sum_{\substack{a\in A\\ a> x}}\frac{1}{a\log a}\leq 1+O\left(\frac{1}{\log x}\right)$$Это не «олимпиадный трюк» и не отполированная демка от компании. Результат лёг внутрь активной базы открытых задач, в участок аналитической теории чисел, где эксперты знали много, но не достаточно. И главное — там нашёлся новый организующий приём, а не просто перебор стандартных техник.
Почему люди десятилетиями не видели подход
Терренс Тао, один из самых известных живых математиков, объяснил ситуацию метафорой шахматной партии: все, кто пытался атаковать задачу, «делали лёгкий неверный поворот на первом же ходу». GPT-5.4 этого поворота не сделал.
«Все эксперты, кто пробовал, делали слегка неверный шаг на первом же ходу. ChatGPT этого шага не сделал.» — Терренс Тао, UCLA
Технически «неверный поворот» — это привычка работать с весами log p (логарифмами простых множителей), которая хорошо себя ведёт в большинстве задач про примитивные множества. GPT-5.4 предложил другой вес: функцию фон Мангольдта Λ(n), которая равна log p на простой степени p^k и нулю в остальных случаях. Эта функция фундаментальна в аналитической теории чисел — она появляется во всех формулах про распределение простых, начиная с явной формулы Римана. Но её мало кто пытался прицепить к примитивным множествам, потому что веса log p казались более естественными.
Поверх этого GPT-5.4 ввёл цепь Маркова на простых, кодирующую, как «спускаются» делители вдоль элементов примитивного множества. Анализ хвостов этой цепи и даёт нужную асимптотику. Логика оказалась настолько чистой, что Лихтман в форуме написал «это из Книги» — высшая похвала в номенклатуре Эрдёша.
Как это технически выглядело
Прайс не «попросил ChatGPT решить задачу». Он работал в режиме интерактивного партнёра. По его собственному описанию на форуме:
- сначала он несколько недель читал работы Лихтмана и Эрдёша, чтобы понять, какие формулировки эквивалентны;
- потом он начинал сессии с GPT-5.4 Pro с конкретными подзадачами — оценить такую-то сумму, проверить такое-то неравенство;
- модель часто галлюцинировала; Прайс ловил ошибки, переспрашивал, требовал явных шагов;
- ключевой инсайт про функцию фон Мангольдта появился у модели после смены формулировки задачи — Прайс переписал условие через дзета-подобную функцию.
После того как доказательство было собрано, Прайс пошёл в форум Erdős Problems, где Тома Блум и Лихтман независимо проверили шаги. Лихтман потом дописал follow-up, в котором переорганизовал аргумент и заострил константы. То есть процесс на конце выглядел как нормальная математика: ИИ-генерация → ручная проверка → экспертная переработка.
Чем это отличается от хайпа
С 2023 года было много историй «ИИ доказал теорему». В большинстве случаев речь шла либо о формализации в Lean, либо о решении олимпиадных задач, либо о результатах, которые экспертам казались известными или несложными. Случай 1196 — другой по трём пунктам.
Первое — задача была в публичной базе открытых проблем как открытая. Не «из обзорной статьи», не «по мотивам», а конкретный пункт с номером, который Блум ведёт уже несколько лет. Второе — результат добавляет идею, а не комбинацию известных шагов. Веса фон Мангольдта в этой задаче — это организующий принцип, не очередной перебор. Третье — Прайс не математик. Он не «оптимизировал известный приём» — он не знал ни известных приёмов, ни почему они не работают.
Тома Блум в твите подчеркнул именно последний пункт: «Это пример того, как стечение обстоятельств может работать. Но это и пример того, как сильно изменилось то, что значит быть математиком».
Что это значит для AI-в-математике
Полтора года назад дискуссия про ИИ в математике крутилась вокруг IMO и AlphaProof — то есть олимпиадных задач, у которых короткие решения и понятный формальный язык. Текущий случай — другой режим. Задача нерешена 60 лет, у неё нет известного «короткого пути», и доказательство выходит на пару страниц аккуратного анализа. Это уже про research-уровень, а не про заверенные benchmark-задачки.
Не значит, что GPT-5.4 — теперь автономный математик. Прайс провёл сотни часов на курировании сессий, ловил галлюцинации, переписывал формулировки. Но раньше такое курирование делало бы возможным разве что переоткрытие известного результата. Сейчас оно открывает новый — конкретный, проверяемый, признанный экспертами.
Инфраструктура подсказывает, куда это пойдёт дальше. База Erdős Problems сама по себе — это структурированный список проверяемых вопросов. У сообщества формальной математики есть Lean и mathlib. Появление инструментов, которые умеют генерировать гипотезы и доказательства уровня выше олимпиадного, делает связку «ИИ-агент + публичная база задач + экспертная проверка» рабочим pipeline'ом, а не теоретической возможностью.
Что говорят сами математики
В форумной ветке #1196 реакция сдержанная, но позитивная. Несколько участников отдельно подмечают, что аргумент короче, чем большинство экспертных попыток штурмовать задачу со стороны log-weighted сумм. Лихтман пишет, что собирается провести семинар по follow-up'у в своей группе. Блум обновляет статус задачи на «решена с указанием авторства».
Тао в обсуждении подчеркнул одну тонкость: успех именно таких задач — где есть короткое элегантное решение, но человеческое сообщество не видело его из-за привычки, — может быть систематическим. Современные LLM не «думают как математики»; они комбинируют куски, которые видели. Это иногда даёт преимущество — потому что они не «застревают» на привычной для людей траектории.
С практической стороны это значит, что в ближайший год будет больше похожих историй. Не каждая база открытых задач так аккуратно структурирована, как у Эрдёша, но та же логика приложима к любой области, где есть формальная или полуформальная база результатов: топология, комбинаторика, теория графов, частично — алгебраическая геометрия.
Выводы
Главное, что произошло, — не «ИИ заменил математика». Произошло обратное: один любитель, не входящий в систему, использовал ИИ как усилитель и получил результат, который система с экспертами и грантами годами не могла получить сама. Это не история про вытеснение, а про размыкание входного барьера.
Для исследовательских областей с публичными базами открытых задач это сигнал перестраивать процессы: не «ИИ или человек», а «ИИ-агент + куратор + экспертный код-ревью». Прайс показал, что куратором необязательно должен быть профессор; в его случае это был программист с интересом к теории чисел.
Что ожидать дальше — больше таких случаев в 2026, и постепенное появление специализированных инструментов под этот режим работы. Также — споры про авторство: цитировать ли модель в публикации, как делить заслуги, что считать «оригинальной идеей». Эти вопросы только начинают обсуждаться, и кейс 1196 уже стал в них опорной точкой.

