Всем привет! Меня зовут Андрей, я занимаюсь аналитикой данных в фармацевтической отрасли, сегодня мы разбираем, как GNN, AlphaFold 3 и $2.23 млрд на провал меняют фармакологию

За кулисами невероятных прорывов в биомедицине — от мРНК-вакцин до редактирования генома CRISPR — скрывается фундаментально неэффективный, сломанный процесс: R&D (Research & Development) новых лекарств. Это явление известно как «Долина Смерти»: пропасть между лабораторным открытием и появлением препарата в аптеке.

Но это не просто «долина»; это кризис, который усугубляется в реальном времени. Статистика, которую вы могли знать, уже устарела.

Кризис в цифрах

Стоимость вывода одного препарата на рынок — это уже не $1–2 миллиарда. По данным отчета Deloitte, в 2024 году средняя стоимость выросла до $2.23 миллиарда. Но даже эти инвестиции не гарантируют успеха. Классическое правило «90% лекарств проваливаются в клинических испытаниях» теперь получило еще более суровую интерпретацию.

Ключевой показатель — «Вероятность одобрения» (Likelihood of Approval, LoA), то есть шанс, что препарат, вошедший в Фазу I испытаний, когда-либо дойдет до пациента. Анализ данных за 10 лет (2014–2023) показывает, что этот показатель рухнул до 6.7%.

Но самая шокирующая тенденция скрыта глубже. Анализ Citeline показывает, что если в 2006–2008 годах более 75% препаратов успешно проходили Фазу I (первичный тест на безопасность), то сегодня этот показатель упал ниже 40%.

Метрика

Показатель (данные 2024-2025)

Средняя стоимость R&D на 1 препарат

$2.23 миллиарда

Среднее время R&D

10-15 лет

Общая вероятность одобрения (LoA) с Фазы I

6.7%

Вероятность успеха Фазы I

< 40% (против >75% в 2006-08)

Вероятность успеха Фазы II

~28%

Вероятность успеха Фазы III

~55%

Это не означает, что наука стала хуже. Это означает, что задачи стали неизмеримо сложнее, а индустрия изменила стратегию. Вместо того чтобы тратить сотни миллионов на заведомо провальные Фазы II и III, компании намеренно «убивают» сомнительные препараты как можно раньше, используя в Фазе I биомаркеры для оценки эффективности. Это стратегия «fail faster» — «проваливайся быстрее».

Этот экономический сдвиг создает колоссальный спрос на любой инструмент, который может предсказать провал еще раньше — до того, как в Фазу I будут вложены первые десятки миллионов. Индустрия отчаянно нуждается в новом наборе инструментов. И вот он появляется.


Часть I. Анатомия провала: Почему мы так плохо предсказываем биологию?

Чтобы понять, как ИИ может помочь, нужно детально разобраться, почему 93.3% лекарств терпят неудачу. Анализ причин провалов показывает, что главные виновники — это недостаточная эффективность (молекула не работает) и неприемлемая токсичность (молекула небезопасна).

Проблема в том, что человеческий организм — это не пассивный сосуд, а враждебная среда, которая сотни миллионов лет эволюционировала, чтобы обнаруживать, нейтрализовать и выводить чужеродные химические вещества (ксенобиотики). Любое лекарство для организма — это ксенобиотик.

Чтобы стать успешным, препарат-кандидат должен пройти полосу препятствий, известную как ADMET: абсорбция (Absorption), дистрибуция (Distribution), метаболизм (Metabolism), экскреция (Excretion) и токсичность (Toxicity). Именно на этих «фильтрах» отсеивается большинство кандидатов.

«Метаболическая печь»: Ферменты цитохрома P450 (CYP)

В нашей печени работает целая армия ферментов, известная как цитохром P450. Это главная «метаболическая печь» организма, отвечающая за переработку более 90% всех известных лекарств. Ключевые семейства — CYP1, CYP2 и CYP3 — обрабатывают около 80% клинических препаратов.

Их задача — превращать жирорастворимые (липофильные) соединения в водорастворимые, чтобы почки могли легко вывести их из организма. Но в этом процессе кроется три опасности:

  • Потеря эффективности: Если фермент работает слишком хорошо с нашим лекарством, он уничтожит его до того, как оно достигнет мишени. Лечение провалится.

  • Токсичность: В процессе химической модификации фермент может случайно превратить безопасную молекулу в высокореактивный, токсичный метаболит.

  • Лекарственные взаимодействия: Два препарата (например, антидепрессант и препарат от рака) могут конкурировать за один и тот же фермент CYP. Это может привести к тому, что один из них не будет метаболизироваться, его концентрация в крови опасно возрастет, и пациент получит передозировку.

«Клеточный вышибала»: P-гликопротеин (P-gp)

На поверхности многих наших клеток, особенно в критических барьерах (кишечник, мозг), работает молекулярный насос под названием P-гликопротеин. Его работа — используя энергию АТФ, активно выкачивать широкий спектр соединений обратно из клетки.

P-gp — это главный механизм, лежащий в основе «множественной лекарственной устойчивости» (МЛУ) при раке. Опухолевые клетки начинают производить огромное количество этих насосов и буквально «выплевывают» химиотерапевтические препараты, не давая им подействовать. Если новая молекула-кандидат является «субстратом» для P-gp, она, скорее всего, никогда не достигнет мишени в нужной концентрации. Провал.

«Скрытая угроза сердцу»: Канал hERG

Даже если препарат успешно прошел «печь» CYP и «вышибалу» P-gp, его может ждать провал из-за самой коварной побочной токсичности. Речь о калиевом канале сердца, известном как hERG.

Сердце сокращается благодаря точному электрическому циклу деполяризации и реполяризации. Канал hERG отвечает за фазу реполяризации — это, по сути, «кнопка перезагрузки» сердечной мышцы после каждого удара. Проблема в том, что многие лекарства, не имеющие никакого отношения к кардиологии (например, антибиотики или антигистаминные), по своей 3D-структуре могут случайно «затыкать» этот канал.

Эта блокада задерживает реполяризацию, что на ЭКГ проявляется как «удлинение интервала QT». Это создает нестабильное электрическое состояние, которое может спровоцировать жизнеугрожающую аритмию под названием Torsades de Pointes (пируэтная желудочковая тахикардия). Десятки препаратов были отозваны с рынка именно по этой причине.

Многокритериальная оптимизация

Традиционный, линейный метод R&D искал молекулу по принципу «ключа к замку» (высокая активность к мишени). Затем ее передавали на тесты и с удивлением обнаруживали, что «ключ» идеальный, но он токсичен для сердца или его съедает печень. Приходилось возвращаться к началу. Этот линейный цикл «дизайн → провал → редизайн» и занимает 10 лет и $2.23 миллиарда.

Задача драгдизайна — это не поиск «ключа». Это многокритериальная оптимизация (Multi-Objective Optimization, MOO). Нам нужна молекула, которая одновременно:

  • Максимально активна к мишени (Цель)

  • Минимально активна к hERG (Безопасность)

  • Не является субстратом P-gp (Эффективность)

  • Имеет сбалансированный метаболизм CYP (Эффективность)

  • Растворима в воде (Фармакокинетика)

  • ...и еще десятки других параметров

Человеческий мозг неспособен оперировать 20+ переменными одновременно. Но для ИИ — это и есть поставленная задача.


Часть II. Инструментарий ИИ: От GNN-предсказателей до AlphaFold 3

Искусственный интеллект предлагает новый инструментарий, созданный специально для решения этой многокритериальной задачи.

1. Предсказание свойств: Графовые нейронные сети (GNN)

Традиционно молекулы представляли в виде текстовых строк (например, SMILES), что крайне неэффективно. Молекула — это не строка, это граф, где атомы — узлы, а химические связи — ребра. Графовые нейронные сети (GNN) — это архитектура ИИ, которая «мыслит» на родном языке химии.

Основной механизм GNN называется «передача сообщений» (message passing). Атомы итеративно «общаются» с соседями, обмениваясь информацией о своем типе, заряде и связях. С каждой итерацией узел «узнает» все больше о своем окружении, формируя сложный математический «отпечаток» (embedding) всей молекулы.

Этот «отпечаток» затем подается на простой классификатор для предсказания любого свойства. Мы можем обучить GNN-модели отвечать на критические вопросы: «Будет ли эта молекула блокировать hERG?», «Является ли она субстратом P-gp?», «Насколько она растворима?». Это позволяет in silico (на компьютере) отсеять миллионы плохих кандидатов еще до синтеза.

2. Создание нового: Генеративные модели и Мультиобъективная оптимизация (MOO)

Теперь мы переходим от предсказания свойств к созданию новых молекул. Это дизайн de novo. Простые генеративные модели (например, VAE — вариационные автоэнкодеры) могут сжимать молекулы в «латентное пространство» (набор цифр) и разжимать их обратно, генерируя новые, никогда не виданные структуры.

Но SOTA (State-of-the-Art) 2024–2025 годов — это не просто VAE. Это генеративные модели (GAN, VAE, Diffusion), соединенные с Обучением с подкреплением (Reinforcement Learning, RL) и алгоритмами MOO.

Работает это так:

  1. Генератор (VAE/GAN) создает новую молекулу

  2. Предиктор (GNN) мгновенно оценивает ее по 5–10 параметрам: Активность (Цель), Токсичность (hERG), Растворимость и т.д.

  3. Функция вознаграждения (RL) дает генератору «очки» на основе этих предсказаний. Например: Reward = (2 × Активность) - (5 × hERG_Токсичность) + (1 × Растворимость)

  4. Цикл: Генератор учится создавать молекулы, которые максимизируют эту функцию вознаграждения, то есть одновременно оптимизированы по всем заданным параметрам

Это фундаментальный сдвиг: от отсеивания плохих молекул к проактивному дизайну хороших.

3. Моделирование мишени: AlphaFold 3 и его фундаментальное ограничение

Если AlphaFold 2 (2020 г.) решил 50-летнюю проблему предсказания 3D-структуры белка, то AlphaFold 3 (анонсирован DeepMind и Isomorphic Labs 8 мая 2024 г.) пошел дальше. Он моделирует не только белки, но и их взаимодействия с лигандами (лекарствами), ДНК, РНК и ионами.

Это колоссальный шаг к in silico драгдизайну. Но здесь скрыто фундаментальное ограничение, которое активно обсуждается в 2025 году: «Induced Fit» (Индуцированное соответствие).

Классическая модель «замок и ключ» — это упрощение. В реальности белки — гибкие. Когда лекарство (лиганд) связывается с белком, белок часто меняет свою форму (конформацию), чтобы «обнять» лиганд и обеспечить более плотное связывание.

Независимые исследования и бенчмарки показывают, что AlphaFold 3 прекрасно предсказывает связывание, если белок не меняет форму. Однако он «систематически показывает низкую производительность при предсказании комплексов белок-лиганд, которые включают значительные конформационные изменения». Он не моделирует "induced fit", так как обучался в основном на статических, «замороженных» структурах.

Это не делает AF3 бесполезным. Это означает, что он не «волшебная кнопка», а невероятно мощная отправная точка. Реальный SOTA-пайплайн 2025 года выглядит так:

  1. Взять статическую структуру комплекса из AlphaFold 3

  2. Использовать другие ИИ-модели (например, диффузионные мосты или трансформеры) или классические методы (молекулярная динамика) для моделирования динамического акта связывания и учета "induced fit"

Рынок ИИ-решений не монополизирован AlphaFold; он просто открыл новый, более сложный уровень соревнований.

Сравнительная таблица: Традиционные методы vs AI-решения

Биологический вызов

Традиционный метод

AI-решение (2025)

Предсказание токсичности (hERG, ADMET)

Тесты на животных / клеточных культурах

Графовые нейросети (GNN)

Дизайн новой молекулы

Ручной перебор аналогов (линейный)

Генеративные модели (VAE, GAN)

Одновременная оптимизация (Активность + Безопасность)

Линейный цикл "дизайн → провал → редизайн"

Генеративные модели + MOO/RL

Определение 3D-структуры мишени

Рентгеноструктурный анализ (годы)

AlphaFold 2

Определение 3D-структуры взаимодействия (Белок-Лекарство)

Докинг (неточно)

AlphaFold 3

Моделирование гибкого связывания ("Induced Fit")

Молекулярная динамика (ресурсоемко)

Новые Диффузионные/Transformer-модели


Часть III. От кода к клинике: Первые реальные результаты (2024-2025)

Хайп вокруг ИИ в фарме длится 10 лет. Только сейчас, в 2024–2025 годах, мы получили первые реальные, рецензируемые результаты из Фазы II. И они рисуют очень поучительную картину.

1. Победа: Insilico Medicine и первый в истории успех в Фазе II

Это событие — главная новость в индустрии.

  • Компания: Insilico Medicine, AI-first биотех

  • Препарат: Рентосертиб (Rentosertib, ISM001-055)

История: Это квинтэссенция ИИ-подхода. В 2020 году платформа ИИ компании проанализировала массивы данных и нашла новую биологическую мишень для лечения фиброза — белок TNIK. Затем генеративная платформа ИИ создала de novo (с нуля) молекулу-ингибитор для этой мишени.

Скорость: Весь путь от открытия мишени до дизайна кандидата и старта Фазы I занял менее 30 месяцев. Традиционный процесс занял бы 4–6 лет.

Ключевое событие (Июнь 2025): Результаты Фазы IIa были опубликованы в престижном журнале Nature Medicine. Это не просто пресс-релиз, а полная научная валидация.

Результаты: Препарат не просто безопасен. У пациентов с идиопатическим легочным фиброзом (ИЛФ) он показал статистически значимое улучшение функции легких (среднее изменение жизненной емкости легких FVC +98.4 мл) по сравнению с группой плацебо (у которых наблюдалось падение -20.3 мл).

Это первый в истории «clinical proof-of-concept» (клиническое доказательство концепции) для препарата, у которого и мишень, и сама молекула были созданы с помощью ИИ.

2. Проверка реальностью: Провал BenevolentAI

История BenevolentAI — это идеальный холодный душ для тех, кто поверил в 100% успех.

  • Компания: BenevolentAI, еще один пионер ИИ-драгдизайна

  • Препарат: BEN-2293, разработанный de novo с помощью ИИ для лечения атопического дерматита (экземы)

История: Компания ранее успешно использовала ИИ для репозиционирования (предложив существующий препарат Барицитиниб для лечения COVID-19). Но BEN-2293 был их флагманской новой молекулой.

Результаты: Препарат успешно прошел Фазу I (безопасен, как и предсказывал ИИ). Но в Фазе IIa он провалился по эффективности, не показав никакого улучшения по сравнению с плацебо.

Итог: В 2024 году компания официально объявила о прекращении всех инвестиций в эту программу.

3. Титаны на старте: Гонка 2025 года

Пейзаж 2025 года определяется тремя ключевыми силами:

Exscientia / Recursion: В ноябре 2024 года эти два ИИ-гиганта объявили о слиянии, создав одного из крупнейших игроков на рынке. У Exscientia уже есть огромные партнерские сделки (например, на $5.2 миллиарда с Sanofi) и собственный пайплайн. В 2025 году они запускают новые клинические испытания Фазы 1/2 в онкологии (EXS74539, EXS73565).

Isomorphic Labs (Google / DeepMind): Компания, созданная на базе команды AlphaFold. В июле 2025 года компания впервые объявила, что «активно нанимает персонал» для начала собственных клинических испытаний AI-разработанных лекарств в 2025 году. Получив $600 миллионов свежих инвестиций, Google/DeepMind переходит от теории к клинической практике.

Insilico Medicine: Окрыленная успехом Рентосертиба, компания готовит Фазу IIb/III и продвигает массивный пайплайн из 30+ других ИИ-препаратов.

Сводная таблица компаний и препаратов

Компания

Ключевой препарат

Заболевание

Статус на 2025 год

Insilico Medicine

Рентосертиб (ISM001-055)

Идиопатический легочный фиброз

ПОБЕДА: Успешная Фаза IIa. Доказана эффективность. Публикация в Nature Medicine.

BenevolentAI

BEN-2293

Атопический дерматит

ПРОВАЛ: Фаза IIa не пройдена по эффективности. Программа закрыта.

Isomorphic Labs

(Не анонсированы)

Онкология, Иммунология

НА СТАРТЕ: Активный найм для начала первых клинических испытаний в 2025 г.

Exscientia / Recursion

EXS74539, EXS73565

Онкология

В ИГРЕ: Слияние гигантов (2024). Запуск новых испытаний Фазы 1/2 в 2025 г.


Заключение: Самая важная статистика и новый ландшафт

Итак, что все это значит? У нас есть один громкий успех (Insilico) и один громкий провал (Benevolent). ИИ — это панацея или хайп? Данные 2024 года дают удивительно четкий ответ.

Анализ, сравнивающий ИИ-препараты с историческими данными, выявил два числа, которые объясняют всё:

Успех в Фазе I (Безопасность, ADMET):

  • ИИ-препараты: 80–90%

  • Среднестатистические: 40–65% (и <40% в последней когорте)

Успех в Фазе II (Эффективность):

  • ИИ-препараты: ~40%

  • Среднестатистические: ~28–40%

Эти два показателя — самый важный вывод

Во-первых, тот факт, что ИИ-препараты имеют 80–90% успеха в Фазе I, доказывает, что ИИ-инструменты (GNN-предикторы, MOO-генераторы) уже решили (или почти решили) проблему «лекарственной пригодности» (druggability). ИИ действительно отсеивает молекулы с плохим ADMET/hERG-профилем до начала испытаний, экономя сотни миллионов.

Во-вторых, тот факт, что в Фазе II их успех составляет в среднем 40%, доказывает, что ИИ пока не решил более сложную, биологическую проблему. Фаза II отвечает на вопрос: «Даже если у вас есть идеальная, безопасная молекула, которая бьет в мишень, действительно ли эта мишень важна для лечения болезни у сложного, живого человека?» Провал BenevolentAI — тому яркий пример.

«Долина Смерти» не исчезла. ИИ сместил ее.

Раньше индустрия массово проваливалась в Фазе I из-за плохой химии. Теперь, благодаря ИИ, она будет проваливаться в Фазе II из-за сложной биологии. И это — колоссальный шаг вперед. Это позволяет «терпеть неудачи умнее», фокусируя ресурсы не на синтезе заведомо токсичных молекул, а на фундаментальном понимании болезней.

Успех Insilico доказывает, что ИИ может найти и правильную химию, и правильную биологию. Провал BenevolentAI показывает, что это все еще невероятно сложно. Мы решили первую часть уравнения (молекулу). Теперь ИИ-гонка (во главе с Isomorphic Labs) переходит к следующему рубежу: моделированию не просто молекулы, а всей болезни.

Финальная таблица: Традиционный vs AI-подход

Клиническая фаза

Тестируемый параметр

Традиционный успех (2014-2023)

Успех AI-first препаратов (2024)

Вывод

Фаза I

Безопасность и Фармакокинетика (ADMET, hERG)

~40-65% (с падением до <40%)

80-90%

ИИ решил (или почти решил) эту проблему.

Фаза II

Эффективность (Правильность мишени)

~28-40%

~40%

Это новый главный барьер. ИИ пока не дает преимущества.


Все модели обучаются на гигантских публичных базах данных, таких как ChEMBL (данные о биоактивности), ZINC (миллиарды 3D-структур) и PubChem.

Комментарии (3)


  1. bighorik
    09.11.2025 17:15

    Ого, незаминусованная статья про ии? Не уж то дело не в упоминании ии, а в качестве статьи?

    Отличная статья, работаю разработчиком в фарме, было интересно углубиться в подробности испытаний и технические решения местных трудностей)


    1. GenomeDust Автор
      09.11.2025 17:15

      Спасибо! Я сам не так давно начал работать в фарме, в основном я работаю с рыночными данными, данными аудита рынков, хотя они тоже имеют специфику, типа категоризации по ATC - https://ru.wikipedia.org/wiki/Анатомо-терапевтическо-химическая_классификация, EphMRA и прочему. Также я для себя пробовал работать с визуализацией молекул в UCSF ChimeraX. На одноименном с моим ником тут канале на ютубе выкладывал, пост из этого не получился бы, там в основном все-таки про визуал. Возможно, вам будет интересно.


  1. sundmoon
    09.11.2025 17:15

    Лет 15 назад читал про первое "на компьютере смоделированное" лекарство - расилез.

    И ещё. Задолго до теперешнего AI-хайпа и до ковида проходила новость о каких-то британских ученых, которые искали компьютерами лекарства, но нашли невиданные в природе сверхэффективные яды, в ужасе всё уничтожили и подписали петицию в Спортлото с призывом себя запретить. Конечно, ломать - не строить... яды искать проще. Понимаю. И даже хотел бы поверить, что на самом деле уничтожили. Но - верится с трудом.