GPT-5.4 Pro решил открытую задачу из Frontier Math
Впервые в истории AI-модель решила нерешённую математическую задачу из набора Frontier Math. За GPT-5.4 Pro это повторили Opus 4.6 и Gemini 3.1 Pro.
Три месяца назад это считалось невозможным. 26 марта GPT-5.4 Pro стал первой AI-моделью, решившей открытую математическую задачу из набора Frontier Math: Open Problems — коллекции нерешённых задач, которые не поддавались профессиональным математикам.
Что произошло
Задача называется Ramsey Hypergraphs — она относится к теории экстремальных графов и до сих пор не имела решения. GPT-5.4 Pro нашёл его методом доказательства через пример: модель написала Python-скрипт, который сгенерировал ранее не известные гиперграфы, удовлетворяющие условиям задачи.
Это не традиционное математическое доказательство в привычном смысле — модель не вывела формулу и не построила цепочку теорем. Вместо этого она использовала программирование для конструирования конкретных объектов, которых раньше никто не находил. Полный транскрипт и разбор решения опубликованы на сайте Epoch AI.
Не только GPT
После того как GPT-5.4 Pro показал путь, исследователи из Epoch создали общий фреймворк для тестирования моделей на открытых задачах Frontier Math. Результаты оказались показательными: ту же задачу впоследствии решили Opus 4.6 от Anthropic и Gemini 3.1 Pro от Google. При этом Gemini 3 Deep Think с задачей не справился.
Это говорит о том, что способность решать открытые математические проблемы — не уникальная особенность одной модели, а эмерджентное свойство, которое появляется у моделей определённого уровня.
Почему это важно
Frontier Math: Open Problems — это не обычный бенчмарк. Это задачи, которые не решены людьми. До сих пор AI-модели оценивались по способности воспроизводить известные решения. Теперь впервые модель создала нечто, что не существовало до неё.
Скептики справедливо замечают, что доказательство через пример — это программный перебор, а не математическая интуиция. Но сам факт того, что модель смогла сформулировать подход, написать корректный код и найти решение, которое не находили математики, — это качественный сдвиг в понимании возможностей AI.
Обсуждение на Hacker News набрало 380 пунктов за первые часы. Консенсус сообщества: это не AGI, но это первый убедительный пример AI как инструмента математического открытия.


