Искусственный интеллект меняет ландшафт научных открытий и значительно ускоряет исследования. Современные системы могут изучать литературу, строить гипотезы и генерировать экспертные статьи — для этого достаточно ввести пару промтов.
Привет, Хабр! Меня зовут Алексей Шпильман, я лидер центра «AI для науки» в Сбербанке. В этой статье я расскажу, как ИИ повлиял на научную среду, какие ИИ-решения сегодня актуальны и какое будущее ждет AI Native Science.
Что изменилось в науке с приходом ИИ
Искусственный интеллект в корне трансформирует науку — как правило, это происходит в двух направлениях:
Количество участников. Раньше ученые сами проводили исследования, писали статьи и работали в командах из 5-10 человек. Сейчас многие процессы можно поручить ИИ-агентам, которых будет контролировать эксперт.
Время на исследование. Традиционные проекты занимали около года — с ИИ работу можно закончить за несколько дней. И даже если исследование включает эксперименты, срок все равно сократится до месяца.

То есть ИИ может заменить львиную долю исследовательской группы, оставив только, так называемых «суперученых», которые будут генерировать новые идеи с помощью ИИ.
Как ИИ проводит исследования
Разберем пример AI Scientist 2 от Sokanа AI, который создает научные статьи без сложных дообучений, LLM-моделей или манипуляций с датасетами. Ученые просто генерируют детальный промпт, а ИИ выполняет задачи — собирает литературу, структурирует данные, генерирует идеи, проверяет их на новизну и выдает результат.
Такой ИИ-агент может свободно делать работу, которую раньше выполняли аспиранты — например, сравнивать информацию или писать черновики статей.
При этом в AI Scientist 2 встроена разветвленная структура, разбитая на 4 этапа:

Preliminary Investigation (предварительное исследование). Включает поиск и проверку гипотез в научной литературе. По сути, система помогает выявить какие исследования уже проводились и какие гипотезы выдвигались.
Hyperparameter Tuning (настройка гиперпараметров). Оптимизирует параметры модели так, чтобы результаты анализов были точными и полезными для дальнейшей работы. Помогает извлекать более достоверные данные и создавать качественные визуализации для статьи.
Research Agenda Execution (реализация исследовательской программы). Проводит глубокий анализ гипотез, выдвинутых на этапе предварительного исследования — это финальная часть для черновой статьи.
Ablation Studies (исследования абляции). Оценивает влияние различных факторов на результаты исследования и помогает отфильтровать ненужные или несущественные данные.
Эта система охватывает весь научный процесс — от проверки гипотез до анализа результата. То есть делает тоже, что и ученые, только через промпты в LLM-агентах.
Недавно команда AI Scientist 2 сгенерировала три научные статьи и отправила их в воркшоп «I Can’t Believe It’s Not Better», посвященный способам применения глубокого обучения. Из трех материалов приняли только один — поэтому судить об успешности Sokanа AI можно по-разному. С одной стороны, хорошо, что прошла хотя бы одна статья, с другой — плохо, что остальные не выдержали отбор.

Еще один пример — стартап Intology с обновленной моделью Zocchi. Они также отправили статью на ACL, и она попала в топ-8% принятых работ. Учитывая, что на ACL утверждают всего 20% материалов, это исследование вошло в лучшую половину всех проектов.
При этом иллюстрации и форматирование ссылок для статьи Zocchi делали люди — но в будущем и это будет поручаться ИИ.

Например, в центре Сбера «AI для науки» уже разрабатывают проект по автоматическому созданию научных иллюстраций. То есть достаточно добавить этот модуль, и ИИ будет делать полноценные материалы — с текстом, графикой и ссылками.
Но учитывая, что с помощью ИИ можно создавать сотни статей в короткий срок, представление о том, что является важным для науки меняется. Поэтому уже сейчас нужно переосмыслить, как измерять экспертность исследователей — по количеству или все же по качеству работ.
Кроме того, возникает этическая проблема. Даже если из 30 сгенерированных работ пройдет 10, проверять их все равно будут люди — а это отнимет много времени и сил.
Автоматизация науки в ближайшие годы
Ранее прогнозировалось, что автоматизация в науке начнется к 2030 году, а к 2035 году люди перестанут заниматься научной работой вручную. Однако события развиваются быстрее и изменения могут наступить гораздо раньше. Возможно уже в ближайшие несколько лет мы станем свидетелями значительного сокращения числа традиционных ученых.
При этом, ИИ-автоматизация затронет разные сферы цифровой науки — в том числе разработку новых лекарств. Например, Future House представил проект Robin, который использует ИИ для медицинских исследований.
Система оценивает биохимию болезни, анализирует научную литературу и предлагает гипотезы возможных методов лечения. Но для полноценной картины может потребоваться несколько последовательных экспериментов, которые все еще проводят люди.
Также Future House использует многоагентные системы, которые занимаются разными аспектами исследований, например:

Crow. Анализирует научные работы вместе с Robin и предлагает идеи для тестов.
Falcon. Использует синтез данных из литературы и экспериментальных исследований, а затем генерирует возможные терапевтические кандидаты.
Finch. Проводит глубокий анализ данных и визуализацию результатов, которые были получены в ходе экспериментов.
Но и эта система далека от полной автоматизации — здесь также нужно вводить промпты и объяснять ИИ, как искать информацию, что сравнивать и как выдавать результат.
Если говорить о тотальной ИИ-автоматизации науки, то для этого понадобятся роботизированные лаборатории. Но пока что лабораторные исследования отнимают у ученых большую часть времени — особенно при работе с манипуляторами.
ИИ и мультинаучность
В будущем ИИ можно будет использовать в мультинаучности и стирать границы между такими дисциплинами, как биология, химия и физика.
Например, на этом скриншоте видно, как ИИ обучается на основе нескольких языков и использует нейроны, которые связывают иностранные слова. К примеру. слова на английском «противоположный» и «маленький» система переведет на китайский, как «большой».

Поэтому будет интересно, как ИИ объединит разные научные понятия, которые раньше не сочетались. Например, скомбинирует данные о химических реакциях, биопроцессах в клетках и физике наночастиц для создания новых методов доставки активных веществ в определенные ткани организма.
На следующем скриншоте пример ИИ, где можно задействовать нейрон, отвечающий за французский язык — в этом случае система ответит на французском вместо китайского.

Этот подход можно применить и в научной сфере — например, составить задачу по химии, а потом задействовать нейрон, который отвечает за биологию, и посмотреть к чему это приведет.
Заключение
Внедрение ИИ в науку меняет не только общий процесс исследований, но и саму концепцию научных открытий. Уже сегодня с помощью ИИ можно создавать статьи в десятки раз быстрее, чем это делает группа ученых. Так исследователи могут сосредоточится на генерировании идей и отказаться от рутинных задач, вроде вычитки литературы и формирования гипотез.
При этом, научный ИИ пока не автономен. Он все еще зависит от промтов, физических экспериментов и, главное, от экспертизы сгенерированных статей, которые не всегда выходят качественными.