
Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.
Со стороны медицина может казаться консервативной областью: латынь, болезни имени врачей прошлого, концепции, уходящие корнями в донаучную интуицию. На самом же деле для медицины хардкорные инновации — это вещь вполне привычная.
Был в семье рак груди? В каждой вашей клетке 46 разных молекул ДНК, каждая по два метра длиной в развороте, и по три гигабайта данных в каждой. Хотите, развернём нужный фрагмент, прочитаем код и посмотрим, есть баги или нет. Вперёд на ПЦР. С вас 500 рублей.
Храпите? В вас достаточно водорода, а его ядро — это протон, у которого есть спин и прецессия. Поэтому ложитесь в трубу с двумя тоннами жидкого гелия и сверхпроводящими магнитами. Замерим антенной мегагерцовые колебания протонов и программно превратим их в трёхмерное изображение вашего надгортанного хряща. Это МРТ. С вас 1000 рублей.
Поэтому, когда появляется искусственный интеллект, для врачей это ещё один хитрый инструмент, и планка ожиданий весьма высока. При этом, как мы все знаем, ИИ пока лучше всего справляется с задачами типа «написать реферат, который должен выглядеть убедительно». В медицине это не прокатит, решения модели буквально касаются того, чем люди дорожат больше всего.
С другой стороны, есть и фактор, который упрощает жизнь разработчикам. Зачастую, когда дело доходит до обсуждения вариантов использования ИИ, слышишь про индивидуальный подход к лечению, уникальные лекарства и т. п.. Настоящая же, экономически обоснованная потребность состоит не в лакшери‑персонализации, а в автоматизации наиболее массовых и рутинных операций.
Учёба
GigaChat запустили в 2023 году. Я, разумеется, сразу же решил его проверить и задал простой вопрос: «Как лечить инсульт?» Сначала всё выглядело вполне достойно, но где‑то на шестом пункте модель вдруг посоветовала использовать масло какао. Ну понятно, нахваталась сомнительных данных на каких‑то сайтах ароматерапевтов.
Без тщательной фильтрации обучающего материала не обойтись. Курируемый претрейн критически важен. Мы начали собирать всё, что можно было достать: учебники, руководства, статьи. В итоге накопили порядка 500 тысяч страниц отечественной медицинской литературы и других источников: авторитетных сайтов, деперсонализированных медицинских документов и так далее. Для человека это объём колоссальный, а для модели — капля в море.
Добавили англоязычные источники — ещё примерно 5 миллионов страниц. Звучит внушительно, но, увы, знания в медицине быстро устаревают. Скажем, в анатомии изменений немного и учебники десятилетиями остаются актуальными. Руководство по кардиологии десятилетней давности — это, скорее, проблема. Если вы по нему станете лечить, то придут проверяющие и зададут неприятные вопросы. То есть, период полураспада компетенции в нашей отрасли стремительный. В итоге мы ограничились только самыми свежими источниками и закончили на этом с претрейном. Новых руководств выходит немного, и даже их достаточно просто и быстро обработать, что мы и делаем.
Теперь мы сосредоточены на supervised fine‑tuning, обучении с учителем: с нами работает около четырёх сотен медиков, в основном преподавателей медицинских вузов, которые занимаются развитием модели на нашей платформе TagMe.
На этом этапе перед нами встал новый вызов: стало ясно, что без сертификации дальше двигаться трудно. Модель показывает себя хорошо, успешно проходит отраслевые бенчмарки (RuMedBench, ruTXTMedQFundamental), в сравнительном тестировании на русском языке с западными, китайскими и отечественными моделями мы стабильно выглядим уверенней, но как верифицировать её так, чтобы было понятно людям из медицины?
Так появилась идея: если модель работает с людьми, то пусть проходит проверку так же, как человек. Не по условным метрикам, а по понятной системе аккредитации, аналогичной врачебной или фармацевтической.
Так и сделали. Поехали в медицинский вуз, тянули экзаменационные билеты, отвечали. Аккредитации, которые сдают врачи на компьютере, прошли, копируя на глазах у комиссии задания с экзаменационного ресурса в наш интерфейс и проставляя те ответы, которые даёт модель. Из 72 существующих медицинских специальностей мы по официальным сдачам вошли в первую дюжину, но «дома» дополнительно прогнали гораздо больше аккредитаций.
Для ПО, в теории, существует ещё процедура получения регистрационного удостоверения на медицинское изделие, но для регистрации LLM‑решений методологии ещё нет (ни у нас, ни в США и Европе). Как только государство разработает правила, мы немедленно двинемся и по этому пути.
К практике
Но, как известно, non scholae, sed vitae discimus (мы учимся не для школы, а для жизни). Пришло и время загружать GigaChat реальной работой.
В ближайшие 3–5 лет мы планируем развивать генеративный искусственный интеллект в медицине по нескольким практическим направлениям:
управление здоровьем;
диагностика;
лечение;
автоматизация рутинных процессов.
Первый и самый очевидный вектор — здоровый образ жизни, ЗОЖ. Честно говоря, секретов там практически никаких. Нужно дольше спать, меньше есть, больше двигаться и не курить сигареты. Чтобы донести эту информацию до пациента, искусственный интеллект, вроде бы, не обязателен. Он нужен тут, скорее, для того, чтобы грамотно задалбывать пациента и бодро отвечать на вопросы.
Человек ежедневно делает около 200 выборов, влияющих на его здоровье: поехать на лифте или подняться по лестнице, съесть ещё картошки или нет, и так далее. Если подключить непрерывный сбор данных из уже существующих источников, от гаджетов до биллинга, то можно выявлять паттерны, свойственные нездоровому поведению и мягко (или жёстко, кому как нравится) сподвигать человека больше так не делать.
Когда дело доходит до каких‑то жалоб — добро пожаловать на СберЗдоровье. Там в мобильном приложении пользователям доступен AI‑помощник по здоровью. В его разработке важную роль сыграл Институт AIRI. Помощник может уточнить симптомы, предположить диагноз, подсказать, что делать дальше: пройти обследование, записаться к нужному врачу.
В результате врач получит собранный анамнез и ознакомится с ним перед консультацией. В некоторых ситуациях, впрочем, важно, что чат‑бот может начать оказание помощи раньше. Например, в тяжёлой депрессии человеку сложно дойти до врача (даже если речь о дистанционном приёме). Нужно решиться записаться, дождаться приема, а там ещё и непонятно, кто тебя встретит, и непонятно, чем всё это обернётся. Снижение порога доступности благодаря боту — научно доказанный эффект. Многим людям проще начать разговор с компьютером: так меньше тревожности, стигмы, меньше опасений, что тебя не поймут или оценят предвзято. Это работает и уже помогает.
Контроль
После того как человека полечили, начинается следующий этап: нужно проверить, было ли это лечение корректным. На первый взгляд задача кажется простой. Есть протокол приёма или выписной эпикриз — документ, в котором описано, как именно лечили пациента. Есть клинические рекомендации — объёмный PDF на 150 страниц, написанный в неструктурированной и довольно гуманитарной форме, где изложено, как, в принципе, должно выглядеть лечение при этом диагнозе.
Сейчас всё устроено так: вы лечитесь в поликлинике, и затем, в зависимости от диагноза, с вероятностью 0,1–10% вашу историю болезни смотрит представитель страховой или фонда ОМС. Например, он видит, что в карте не указан рост, и отказывает в оплате услуги.

Но бывают и более серьёзные случаи, когда упущены важные элементы терапии. Именно здесь можно применять языковую модель, чтобы не выборочно, а системно сверять медицинские документы с клиническими рекомендациями. Это отличная, сложная и нужная техническая задача. Мы уже активно работаем в этом направлении. Выше показан скриншот нашей демоверсии, которая уже умеет проводить такую проверку.
Дальше можно автоматизировать некоторые виды приёмов. Понятно, что первый визит к эндокринологу («сдайте эти анализы и приходите») или последний — к терапевту («закрываем больничный, всё хорошо») — это задача, которую можно автоматизировать. Уже есть медучреждения, которые готовы начать так делать. Каждый не проведённый очно приём — это более короткая очередь для тех пациентов, которым это действительно нужно, а, может быть, в прекрасном будущем — и больше времени у врача на больного.
Главный запрос к такого рода системам — наличие настоящего рассуждения у модели. Такая функция уже появилась в GigaChat: вы можете попросить модель показать все этапы её рассуждения, как она пришла к финальному выводу. Это критически важно. В клинической практике важна прозрачность действий, чтобы мы могли понять, как и почему получен результат. Врачи привыкли опираться на чёткие патогенетические схемы, и необъяснимые решения могут вызывать у них отторжение. В лечении рассуждения — основа доверия.
При всём этом есть один принципиально важный момент: такие подходы работают только при наличии качественно собранных данных. И здесь есть практический совет. Если к вам приходит медицинская команда с идеей применить ИИ, то первое, что нужно спросить — какого объёма у них датасет. Часто звучит ответ: «У нас огромная база, аж 1400 случаев», а нам нужен миллион. Поэтому централизованная система оказывается реально полезной. Когда в десятимиллионном городе есть единая база, которая ведётся уже лет семь, становится возможным делать действительно удивительные вещи.
Ну а пока наш GigaChat устроился на работу в одну из аптечных сетей на позицию помощника фармацевта. Это агент с определённой логикой, покрывающей целый ряд известных сценариев, и с отдельной базой, в которой лежат все инструкции к препаратам и другие материалы. Когда накопились ответы модели, мы стали оценивать её работу. Привлекли фармацевтов, выгрузили всё на TagMe, и специалисты разметили ответы по шести различным шкалам. Итоговая оценка по безопасности получилась 98,67%. Это много или мало?
Если показать это число врачу, то он скажет, что это неприемлемо. Потому что остальные 1,33% — это потенциально опасные советы. Обычно на этом месте разговор заканчивается.
Суть будущего в другом. Искусственный интеллект не соревнуется с идеалом, он соревнуется с человеком, выполняющим аналогичную работу.
Я сам по образованию врач. Когда я стою в очереди в аптеке и слышу, что советуют фармацевты, у меня иногда волосы встают дыбом. Вот все эти советы вроде «химию лучше не пейте, есть же отличные растительные средства» — это реальность. Наш тезис в том, что реального медианного специалиста мы уже обогнали, а значит подключение нашего агента улучшает ваши шансы избежать некорректной рекомендации.
Ещё один важный подход заключается в том, что не всегда нужно решать все поступающие случаи. Например, есть исследования, на которые отправляют всех пациентов — флюорография, маммография и другие. Это значит, что большинство результатов таких обследований — «всё ОК». В таком случае достаточно обучить модель корректно определять норму и в первую очередь бороться за отсутствие ложноположительных результатов. Ничего не пропускать, даже если это значит, что иногда сомнительная норма отправляется в патологию. Благодаря этому, в описанном случае нагрузка на человека снижается в пять раз. Вместо 200 снимков за день он просматривает гораздо меньше, но с большей внимательностью. Такой подход продуктивен. Если всё в порядке, то специалисту не нужно включаться. Это похоже на автопилот в самолёте. Когда всё идёт штатно, вмешательство не требуется.
Ответственность, как в авиации, так и в медицине с человека не снимается.
Будущее
Наше представление о будущем строится вокруг персонального помощника в медицине на основе искусственного интеллекта. Он будет распределённым, будет взаимодействовать с человеком, его врачом, гаджетами и всеми медицинскими устройствами. Он будет помогать поддерживать не только физическое, но и социальное, ментальное и психологическое здоровье. Заодно он положительно повлияет и на финансовое благополучие с помощью повышения эффективности и работоспособности человека.
Мы должны влиять не только на выбор конкретной таблетки, но и на уровень ценностей, систему мотиваций, профиль рисков, причём делать это не в момент болезни, а заранее. Только с применением ИИ в условиях беспросветного дефицита медицинских кадров мы сможем сформировать ресурс для заботы о профилактике, предотвращении заболеваний. Врачей на эти задачи не хватает никогда и нигде. И если всё получится, то, как говорится, будем жить до 120. Хотя, конечно, везение тоже никто не отменял.
Не болейте!
Евгений Ночёвкин
руководитель фабрики медицинских навыков GigaChat