При разработке новых лекарств важно вовремя оценить конкурентную среду – какие препараты уже существуют или находятся в разработке для той же болезни (индикации). Такой анализ конкурентов обычно входит в due diligence проекта: инвесторы и фармкомпании вручную собирают данные из разных источников о всех потенциальных конкурентах целевого препарата.

Задача непростая: сведения разбросаны по платным базам, реестрам клинических исследований, научным статьям, пресс-релизам. Названия препаратов могут встречаться в разных вариантах, а список конкурентов постоянно меняется. Пропущенный конкурент или неверно выбранный аналог чреват ошибками в стратегии клинических испытаний и бизнес-решениях. Команда стартапа Bioptic (сооснователь — Андрей Дороничев) предложила автоматизировать эту рутинную работу с помощью агентной AI‑системы на базе больших языковых моделей (LLM).

Всем привет. Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета zerocoder.ru. Сегодня узнал о еще одном важном шаге в деле ускорения анализа и сбора информации с помощью ИИ. На этом примере — в медицине.

AI-система вместо аналитика

Bioptic разработала многошаговую LLM-агентную систему для автоматического картирования конкурентов по заданной болезни. Если традиционно аналитик за 2–3 дня просматривал отчёты и сводил списки препаратов-конкурентов в таблицы, то теперь эту работу выполняют связка AI-агентов.

Первый агент получает на вход название болезни (индикацию) и ищет все препараты, составляющие конкурентный ландшафт по этой индикации. По сути, он добывает из разнообразных источников список потенциальных конкурентов и для каждого сразу извлекает ключевые атрибуты — например, тип препарата, механизм действия, стадия разработки, компания разработчик и т.д.
Затем подключается второй агент — LLM-судья, который проверяет и отфильтровывает ложные находки, устраняя галлюцинации модели. Такая проверка повышает точность: в итоговый список конкурентов включаются только подтверждённые препараты. В результате система имитирует работу команды аналитиков, но в полностью автоматическом режиме.

Архитектура агентной системы Bioptic: многоагентный парсер превращает сырые текстовые документы (меморандумы анализа) в структурированные данные. Затем агент поиска конкурентов собирает конкурирующие препараты по каждой болезни, а агент-валидатор (LLM-as-a-judge) отсеивает лишнее. Схема из оригинального исследования:

Ключевые особенности

В основе решения — современные большие языковые модели. Авторы отмечают, что существующие LLM (например, GPT-4 в составе готовых сервисов) считались перспективным инструментом для такой задачи, но «из коробки» не умеют полноценно находить все названия конкурирующих препаратов. Кроме того, не было общепринятого набора данных для объективной оценки качества.

Команда Bioptic преодолела эти проблемы следующим образом:

Во-первых, система получила доступ к специализированным источникам данных (лицензионные фарм-реестры, клинические базы, новости).

Во-вторых, AI-агенты были обучены извлекать факты строго с опорой на исходные тексты и игнорировать неподтверждённую информацию — использовались шаблонные промпты, требующие приводить доказательства из источников, что снизило риск галлюцинаций.

В-третьих, для оценки эффективности разработчики создали собственный тестовый корпус из внутренней информации: за пять лет работы одного биотех-венчурного фонда накопились десятки аналитических меморандумов, и LLM-агенты преобразовали их в структурированную базу знаний, сопоставив болезни с известными конкурентными препаратами. Этот корпус стал бенчмарком для сравнения разных подходов.

Скорость и полнота против конкурентов

На созданном компанией бенчмарке агентная система показала полноту (recall) 83%, то есть отыскала 83% всех конкурентов, которые присутствовали в экспертных материалах. Для сравнения, тестирование альтернативных решений дало заметно более низкие результаты: ~65% у некой внутренней разработки OpenAI (названной Deep Research) и ~60% у коммерческого AI-сервиса Perplexity Labs.

Таким образом, специализированный LLM-агент от Bioptic превзошёл общие системы OpenAI и Perplexity по способности находить максимум релевантных препаратов. Важно, что при высокой полноте система сохраняет приемлемую точность — благодаря этапу валидации практически нет «лишних» препаратов в списке.

Сравнение качества моделей в задаче поиска конкурентов: система Bioptic сохраняет высокую полноту результатов даже на более сложных случаях, тогда как базовые решения теряют многие позиции на трудных примерах. График из исследования показывает долю найденных конкурентов в зависимости от уровня сложности запроса:

Практический эффект

Компания Дороничева уже внедрила в работу эту разработку. В кейсе с одним из инвестфондов платформа существенно ускорила аналитиков: время на подготовку конкурентного обзора снизилось с ~2,5 дней до ~3 часов. То есть задачу, которая раньше отнимала почти три рабочих дня, AI выполняет примерно за одно утро – в 20 раз быстрее. При этом охват информации даже вырос, ведь машина не устает перечитывать тонны документов.

Аналитики отмечают, что такой инструмент снимает рутинную нагрузку и позволяет сосредоточиться на высокоуровневых выводах и решениях. Система полезна и фармкомпаниям при планировании клинических исследований, и инвесторам при оценке стартапов — она быстро выдаёт полный перечень конкурентов по любому запросу и поддерживает его в актуальном состоянии (агенты постоянно мониторят появление новых данных).

Что в итоге?

Опыт Bioptic демонстрирует, как агенты на базе LLM могут решать узкоспециализированные задачи лучше и быстрее людей. Ключевое преимущество — умение агрегировать разрозненные данные и сразу представлять их в структурированном виде.

Конечно, живые эксперты продолжают задавать критерии и проверять особо важные моменты, но большая часть поисково-аналитической работы может быть автоматизирована. В результате due diligence в биофарме переходит на новый уровень эффективности: скорость, масштаб и полнота анализа повышаются на порядок.

Подход, опробованный на конкурентной разведке для лекарств, может быть распространён и на другие области, где требуется обрабатывать массивы разнородной информации. Команда Bioptic опубликовала подробности в исследовании на arXiv, и их результаты вселяют оптимизм, что LLM-агенты станут надёжными помощниками специалистов в самых разных сферах.

Комментарии (0)