Источник изображения

Новость «ИИ опроверг важную гипотезу Эрдёша» нашумела, в том числе на Хабре. Но всем, кроме математиков, по громким заголовкам сложно понять масштаб события. Что это значит: революцию в науке или мелкую разовую удачу? Как это правильно оценить?

Мы в Kodik занимаемся не математикой, а редактором кода с ИИ. Но именно поэтому такие истории интересны и нам: они позволяют наблюдать не просто очередной виток хайпа вокруг LLM, но и постепенный заход ИИ в области, которые ещё недавно считались слишком сложными для подобных систем.

По исходному блог-посту от OpenAI оценить событие сложно, ведь компания заинтересована приукрашивать возможности своей модели. Но среди опубликованного OpenAI есть и более ценный материал: мнения ряда математиков о произошедшем.

Конечно, это тоже не абсолютная истина, математики могут ошибаться и быть предвзятыми. Но для понимания контекста подобные экспертные оценки важны. Поэтому мы решили, что на Хабре полезен такой контент, и перевели некоторые мнения из этого материала (с сокращениями). А если вы математик, то в комментариях интересно было бы узнать и ваше мнение.


Томас Блум

Создатель сайта erdosproblems.com

Это была одна из любимых задач Эрдёша — он впервые поставил её в 1946 году и возвращался к ней много раз. Влиятельный сборник «Открытые проблемы дискретной геометрии» Брасса, Мозера и Паха описывает её как «возможно, самую известную (и самую простую в изложении) задачу комбинаторной геометрии». То, что ИИ предложил решение задачи такого масштаба, одновременно удивляет и впечатляет.

Эрдёш был последователен в своей вере в то, что верхняя граница n(1+o(1)) верна; несомненно, его подкрепляло то, что десятилетия шли, а никто не мог улучшить его оригинальную конструкцию. В результате, скорее всего, большая часть усилий людей была потрачена на попытки доказать верхнюю границу, а не на серьёзные попытки её опровергнуть.

16 апреля на сайте erdosproblems.com я включил эту задачу в блог-пост с ироничным заголовком «Топ-10 задач Эрдёша» (возможно, искушая тем самым судьбу). Этот список я составил в ответ на дискуссии вокруг ИИ-решений нескольких других, гораздо более простых его задач. Такие решения заставили некоторых людей ошибочно предположить, что все задачи Эрдёша — это несущественные пустяки, которые оставались нерешёнными только потому, что никто не пытался их доказать. Это совсем не так: многие задачи Эрдёша активно изучались десятилетиями, и в попытках их решить возникали глубокие и сложные методы.

Хотя я верил, что ИИ в итоге добьётся прогресса хотя бы в паре задач из этого списка, я не ожидал, что это произойдёт всего через месяц!

Если бы ИИ доказал гипотезу, это было бы поистине невероятно. А на практике я всё равно был очень удивлён результатом, но удивление немного снизилось, когда узнал, что речь об опровержении с построением контрпримера, и ещё сильнее снизилось, когда узнал природу этой конструкции, которая (в ретроспективе) оказалась естественным, хотя и в высшей степени нетривиальным обобщением оригинальной конструкции Эрдёша на основе решёток.

При изучении конструкции становится понятнее, почему люди упускали её раньше. Она требует стечения нескольких различных маловероятных событий — того, что хороший математик одновременно:

  1. Тратит значительное время на размышления о гипотезе единичных расстояний;

  2. Серьёзно пытается её опровергнуть, несмотря на неоднократные заверения Эрдёша в её истинности;

  3. Верит в перспективность обобщения оригинальной конструкции на другие числовые поля и готов потратить значительное время на изучение таких конструкций; и

  4. Достаточно знаком с соответствующими разделами теории полей классов.

ИИ соответствовал всем этим критериям, и успех здесь перекликается с его предыдущими достижениями: зачастую самые удивительные результаты он выдаёт, когда упорно проходит путями, которые человек мог бы отбросить как не стоящие времени, сочетая сверхчеловеческое терпение со знанием огромного количества технических инструментов.

При оценке важности и влиятельности доказательств, сгенерированных ИИ, я задаю себе вопрос: научило ли это нас чему-то новому? Понимаем ли мы теперь дискретную геометрию лучше, чем раньше? Я думаю, что ответ здесь «умеренно-положительный»: это показало, что теоретико-числовые конструкции могут сказать гораздо больше о таких вопросах, чем мы предполагали; а также что в них может требоваться глубокая теория чисел. Несомненно, многие специалисты по алгебраической теории чисел в ближайшие месяцы внимательно изучат другие открытые задачи в дискретной геометрии.

С другой стороны, возможно, некоторые специалисты в этой области будут немного разочарованы тем, как мало это нам говорит: не вводит никаких мощных новых геометрических инструментов или неожиданных структурных результатов, которых, вероятно, потребовало бы доказательство гипотезы. Но хотя это, возможно, и не то доказательство, на которое мы надеялись, несомненно, эта конструкция и заложенные в ней идеи окажут серьёзное влияние на дискретную геометрию.

И не следует упускать из виду один аспект: хотя оригинальное доказательство, полученное ИИ, было полностью верным, оно было значительно улучшено исследователями в OpenAI и многими другими математиками, участвовавшими в подготовке данной статьи. Человек по-прежнему играет жизненно важную роль в обсуждении, осмыслении и улучшении этого доказательства, а также в изучении его последствий.

Границы знаний очень неровные, и, несомненно, в ближайшие месяцы и годы мы увидим подобные успехи во многих других областях математики, где давние открытые проблемы будут решены ИИ, выявляющим неожиданные связи и доводящим существующий технический инструментарий до предела. ИИ помогает нам более полно исследовать собор математики, который мы строили на протяжении веков; какие еще невидимые чудеса ждут своего часа?


Дэниел Литт

Это первый раз, когда результат автономной работы ИИ впечатляет меня сам по себе, а не просто как индикатор скорости развития. Но конкретный контекст довольно далёк от моей основной сферы компетенции в математике, поэтому я предоставлю другим, более квалифицированным специалистам, комментировать само решение и его значимость. Вместо этого я кратко порассуждаю о том, что это говорит нам о человеческой математической практике.

Есть несколько примеров относительно известных открытых проблем, решённых с помощью довольно короткого и остроумного аргумента: знаменитая гипотеза Какея, доказанная Зеевом Двиром; гипотеза о чувствительности, доказанная Хао Хуангом; и некоторые другие. Можно сказать, что новое решение тоже из их числа. По-моему, такие примеры исторически были редкими, но подозреваю, что мы вскоре обнаружим куда больше таких. Чем объясняются такие случаи? Насколько они распространены? Мне кажется, что ближайшее будущее математических исследований отчасти зависит от ответов на эти вопросы.

Одно из возможных объяснений существования таких «легкодоступных результатов»: те, кто работал над проблемой, зациклились на неоптимальном подходе или убеждении (например, в данном случае на том, что гипотеза Эрдёша была верна). Другое: решение требует идей из областей, с которыми большинство работающих над проблемой незнакомы. Эти объяснения, если они верны, должны вызывать у нас некоторый дискомфорт. Они предполагают, что стимулы к специализации и обособленности, хотя и понятны, стоили нам части высококачественной науки.

В моей собственной области — алгебраической и арифметической геометрии — практикующих специалистов попросту очень мало, поэтому можно сказать, что там все проблемы сталкиваются с дефицитом внимания. С другой стороны, мне кажется необычным, когда ответы на известные открытые проблемы оказываются доступными благодаря остроумному аргументу, а не новой теории. Многие из нас работают над программами, а не над конкретными задачами (хотя лично я считаю себя специалистом по решению задач). Будет интересно посмотреть, как ИИ повлияет на эти области; до сих пор это влияние было минимальным, хотя я ожидаю, что такое положение дел продлится недолго.

Наконец, познавательно сравнить работу математиков-людей и самый продуктивный текущий подход к математике с ИИ. Люди, движимые личным любопытством, выбирают небольшое количество вопросов и пытаются глубоко их изучить. А лучшие результаты автономного ИИ в математике, наоборот, были получены перебором целых списков проблем с решением некоторой части из них. Это колоссальное расширение внимания, направленного на математические задачи, и, возможно, в будущем оно поможет лучше сфокусировать внимание и любопытство людей.


Мелани Мэтчетт Вудд

Здесь легко сделать поспешные выводы. Но то, что это событие говорит нам о людях, ИИ и математике, более нюансированно. Я считаю, что если бы всех экспертов, представленных в этом материале, собрали месяц назад для поиска контрпримера к этой гипотезе, и они потратили бы на это столько же времени, сколько на чтение и размышления над решением ChatGPT, то нашли бы контрпример. Однако без доказательства от ChatGPT у нас не было бы никаких особых причин искать контрпример и собирать группу экспертов, а у экспертов — обращать свое внимание на эту проблему. Этот напоминает нам о том, как часто в математике интересные и важные вещи происходят из-за переноса идей из одной области в другую, и побуждает задуматься, как ИИ может помочь найти больше междисциплинарных приложений.

К тому же тут мы не видим все те случаи, когда ИИ заявлял о наличии доказательства чего-либо, но ошибался. А без этого контекста (который у многих из нас есть просто по личному опыту) тоже легко сделать неверные выводы о текущем состоянии ИИ и исследовательской математики. Во многих случаях для ИИ проще будет убедить людей в наличии доказательства, чем придумать правильный математический аргумент, и я считаю, что мы, математики, недостаточно к этому подготовлены.

Еще одна проблема, которая непосредственно возникает в связи с этим результатом, заключается в том, что в литературе существует история тесно связанных идей, некоторые из которых упомянуты выше, но которые не были должным образом упомянуты в тексте GPT. Если бы человек выдвинул такой тезис и не сослался на подобные предыдущие работы, мы бы предположили, что он не был знаком с этими работами и пришёл к идеям самостоятельно, поскольку наши профессиональные нормы требуют от нас цитировать работы, повлиявшие на нашу. С другой стороны, GPT в некотором смысле «знаком» со всеми предыдущими работами. В будущем мы можем ожидать, что люди будут писать множество статей, включающих идеи, предложенные ИИ. Математикам необходимо задуматься о том, каковы лучшие практики и правильное цитирование в подобных ситуациях, и прийти к общему пониманию в рамках сообщества.

В правильном контексте из этого и других событий мы видим, что ИИ будет играть
все более важную роль в исследованиях в математике. Как математическому сообществу, нам срочно нужно планировать, как мы можем обеспечить строгость и правильность нашей работы, должным образом признать влияние предыдущих идей и сохранить высокий уровень понимания математики человечеством по мере того, как мы продвигаемся вперед в использовании ИИ как части процесса исследовательских математических исследований.


Джейкоб Циммерман

Это действительно впечатляющая работа, и я бы без колебаний принял её в любой журнал. Я сам некоторое время работал над этой задачей и пытался построить контрпример, но не продвинулся.

По совету Бориса Алексеева я размышлял над этой проблемой, допуская, что контрпример может возникнуть из варьирующегося семейства числовых полей ограниченной степени. Идея об увеличении степени приходила мне в голову, но это очень пугающая динамика, которая часто ни к чему не приводит.

Хотя в итоговом решении нет ничего сверхъестественного, существует множество способов реализовать эту конструкцию. Трудно разобраться до конца, даже если понимаешь суть происходящего. Всегда велик соблазн взглянуть на законченное доказательство и объявить его очевидным постфактум.

Это может указывать на одно из преимуществ систем ИИ: дело не только в том, что они могут перепробовать все известные методы, но и в том, что они могут «плавать» дольше и в более опасных водах, чем математики, не теряя при этом самообладания. Конечно, пока это нельзя утверждать с полной уверенностью, но происходящее может быть предвестником грядущих перемен.


Нога Алон

Это была одна из любимых задач Эрдёша; я сам неоднократно слышал, как он упоминал её в своих лекциях. Полагаю, будет справедливо сказать, что каждый математик, работающий в области комбинаторной геометрии, размышлял над этой задачей, и многие математики из других областей уделяли ей хотя бы некоторое время.

Позволю себе добавить, что хотя на первый взгляд эта задача может показаться развлекательной, это не так: на самом деле она тесно связана с другими разделами математики, включая теорию чисел и алгебраическую геометрию.

Решение задачи внутренней моделью OpenAI является, на мой взгляд, выдающимся достижением, закрывающим давнюю открытую проблему. Тот факт, что правильный ответ не n(1+o(1)), удивителен, а сама конструкция и её анализ используют довольно сложные инструменты алгебраической теории чисел элегантным и остроумным способом. Как отмечено в комментариях некоторых моих коллег, существует несколько причин, объясняющих, почему инструменты ИИ могут быть лучше людей в поиске подобных конструкций. Соглашаться с этими доводами или нет, фактом остается то, что ИИ смог сделать здесь то, что пытались и не смогли сделать многие выдающиеся исследователи-люди.

Как и у других математиков, имевших возможность поэкспериментировать (пусть и недолго в моем случае) с ChatGPT Pro 5.5, у меня сложилось впечатление, что инструменты ИИ способны радикально изменить математические исследования. Новое впечатляющее решение задачи Эрдёша о единичных расстояниях убеждает меня в том, что трудно переоценить потенциальное влияние этих перемен.


Выводы

Как и можно было ожидать, у математиков оказались умеренные и вдумчивые позиции, избегающие крайности «всё, математика решена». Их мнения можно просуммировать таким набором тезисов:

  • Произошло значимое и впечатляющее событие, ИИ в математике впервые справился с настолько заметной задачей, которой люди ранее безуспешно уделяли много времени.

  • Но стоит не преувеличивать его масштабы и помнить ограничения. ИИ стал полезен в достижении некоторых математических целей, но далеко не всех. Публика видит успешные случаи, но не слышит про множество ошибочных попыток (и про риск принять ошибочное доказательство за правильное). ИИ куда хуже людей в сочинении публикаций о доказательствах и в цитировании источников.

  • Важные качества ИИ — скорость и неутомимость. Люди попросту ограничены временными рамками. Они не могут тратить всю жизнь на проверку маловероятных вариантов, поэтому приоритизируют конкретные направления, выглядящие перспективнее. ИИ может пробовать «изучать каждый путь», и в некоторых случаях это приносит результат.

  • Также важно, что ИИ знаком со знаниями из разных областей одновременно. Обычно математики специализируются на определённой области и незнакомы с многой информацией из других, а она может оказаться ключевой для какой-то проблемы. Польза от ИИ может быть в установлении неочевидных связей между областями.

  • И ещё одно преимущество ИИ — свобода от некоторых человеческих предубеждений. В данном случае людям десятилетиями мешала распространённость мнения, что гипотеза будет доказана, а не опровергнута. Получается «социальный барьер»: сколько ещё может быть ситуаций, когда люди не пробуют какой-то путь, потому что «не принято»?

Для нас самым интересным в этой истории выглядит темп прогресса. Только летом 2025-го люди обсуждали успехи моделей в задачах формата Международной математической олимпиады. Тогда далеко не все были уверены, что от них всё перейдёт к текущим событиям. И совсем уж немногие ожидали, что этот переход может занять меньше года. Скорость роста опередила ожидания.

Мы работаем с LLM над совсем другими задачами (используем их в нашем редакторе кода), но в своей практике тоже видим высокую скорость развития. Например, модели со временем стали гораздо лучше справляться с нашим бенчмарком. Так что тезисы математиков подтверждают то, что активный рост происходит в различных направлениях сразу.

И хотя никто не знает будущего наверняка, пока что всё указывает на одно: способности моделей растут заметно быстрее, чем ожидали многие специалисты внутри различных индустрий. А значит, самое интересное впереди. Любопытно, какими будут заголовки на Хабре через год.

Комментарии (1)


  1. skymal4ik
    22.05.2026 16:53

    Для не математиков цитирую гипотезу:

    Сама задача формулируется на школьном уровне: возьмите n точек на плоскости и посчитайте, сколько пар оказались на расстоянии ровно 1. Какое максимально возможное число таких пар? Эрдёш в 1946 году построил пример: на квадратной сетке размером корень из n на корень из n получается чуть больше n единичных пар, то есть рост лишь немного быстрее линейного. Дальше он предположил, что лучше нельзя — сетка по сути оптимальна. За опровержение или доказательство этой гипотезы Эрдёш предлагал денежный приз, а в обзорной книге Брасса, Мозера и Паха задача описана как "возможно, самая известная и самая простая для объяснения проблема комбинаторной геометрии".