Встреча с Богом (х/ф "Космическая Одиссея 2001")
Встреча с Богом (х/ф "Космическая Одиссея 2001")

"Большие языковые модели сегодня — это не просто самые продвинутые алгоритмы машинного обучения. Это новый культурный феномен, меняющий саму природу взаимодействия человека и машины. Они стали тем самым "философским камнем", который превращает слова в код, идеи в функции, а гуманитарные знания — в работающие приложения." -- Gemeni 2.5 Pro

Все годы развития машинного обучения это была территория сугубо технарей. Гуманитарий мог приобщиться к святая святых, только став разметчиком или, в лучшем случае, продакт-менеджером.

Магию творили технари, разработчики, программисты и жрецы высшего уровня — дата-сайентисты (в одном из моих проектов внешний подрядчик называл технического специалиста, разрабатывающего и обучавшего модели, не иначе как "ученый": "Наш ученый посмотрит данные", "наш ученый оценит признаки").

У магов были свои котлы с волшебным зельем, амулеты и магические ингредиенты:

  • Котлы — это базы для хранения озер, морей и даже океанов данных.

  • Ингредиенты — признаки: бинарные, номинальные, категориальные, количественные.

  • Амулеты — алгоритмы, от завораживающей слух непосвященных логистической регрессии до совсем непостигаемых бустингов и стеккингов. Волшебные леса решающих деревьев и загадочные Support Vector Machines.

Маг и чародей — дата-сайентист брал волшебный посох, навешивал на него амулеты, подсыпал в свои котлы ингредиенты и творил волшебство. Что-то бормотал на языке магии, уходящем корнями в древнюю латынь: accuracy, precision, recall, F-мера, roc-auc... давая непосвященным почувствовать всю глубину своего невежества. Бизнес получал (если получал) приросты показателей (подписок, продаж, переходов, увеличение жизни пользователя в приложении, виральности и прочее-прочее), а гуманитарии осознавали всю глубину своей никчемности.

В области компьютерной лингвистики, или, как это модно называть на "аглицкий манер", NLP (слово "процессинг" придает современности, молодежности и шарма устаревшему термину "лингвистика"), все началось с tf-idf, пробежало через BM25, перепрыгнуло LSI, LDA, воодушевилось word2vec, затем doc2vec, повозилось с CNN и с LSTM. А потом, как явление богов, появились "Трансформеры". В эту эпоху еще на недосягаемом Олимпе блистали "технари", но их низвержение было уже предопределено.

Трансформеры быстро проскочили BERTы, T-5 с их сотнями миллионов и единицами миллиардов параметров, GPT-2 , GPT-3 в максимальном размере имеющая 175 млрд параметров. И когда слабые духом заволновались, почувствовав в заморозке метрик качества при росте параметров моделей признаки новой "зимы Искусственного Интеллекта", появилась она: ChatGPT! (как бог в "Космической одиссее 2001"). Или GPT-3 .5, как скромно ее назвали создатели. С момента ее появления размер моделей перевалил за половину триллиона параметров и, возможно, перевалит за триллион (но не будем торопиться).

А обучение сетей и даже адаптеров вдруг заменилось на написание промтов, т. е. обычных фраз на обыкновенном человеческом (русском, английском и т. д.) языке. В 2014 году Курцвейл эпатировал публику обещанием, что компьютер будет понимать человеческий язык к 2020 году. Его пророчество сбылось в 2022 году.

Теперь вместо данных и алгоритмов нужны "промты". Если в "доисторическую эпоху" компьютеру нужно было объяснять, что от него хочет человек, через написание кода (всех этих if-else и прочих def), обучающую выборку, обучение сетей или адаптеров, то теперь для получения результата достаточно сформулировать просьбу, отправить ее в API OpenAI (или другого вендора LLM) и вуаля.

А все "дедовские методы" с обучением сетей и адаптеров, подготовкой выборки обучающей, валидационной и тестовой, в лучшем (для технарей) случае используются для получения LLM-суррогатов, когда религия не позволяет использовать API вендоров и не хватает средств для покупки 8 серверов с картами H100 по 80Gb каждая, чтобы завести, например, собственного "ДипСика". В результате титанической работы, после недель и месяцев усилий достигается качество "почти как у GPT-чего-то-там".

Итак, НЕТ кодингу, классам, функциям, библиотекам, признакам, моделям с Hugging Face, адаптерам с AdapterHub и прочей магии язычников. А чему же тогда "ДА"?

Месть гуманитариев: от промпт-инжиниринга к созданию ИИ-агентов

На место магов от Java, C# и С++ и жрецов от Python выходят те самые, униженные и оскорбленные — гуманитарии, бухгалтеры, юристы, логисты, педагоги, редакторы, издатели. Имя им легион. Их новым ремеслом стал промпт-инжиниринг — искусство составления таких запросов, которые заставляют нейросеть работать максимально точно и эффективно. Оказалось, что для этого не нужно знать Python, но необходимо глубокое понимание контекста, нюансов языка, логики и даже психологии (впрочем все это скорее всего временно и эффекты, например, от "психологического давления" на LLM строго говоря не доказаны). По настоящему нужно понимать задачу, хорошо знать предметную область и уметь сформулировать вопрос к черному ящику. Результат не гарантирован, но "высоковероятен".

Разработчики сами вырыли себе яму. Те из них, кто непосредственно разрабатывает гпт, дипсиков, квенов и антропиков, копали огромный котлован для других, а те, кто задавал вопросы и особенно на них отвечал на Stack Overflow или достигал звезд на GitHub, — маленькие уютненькие ямки для себя. Теперь каждый их ответ, каждый фрагмент кода — это крупица знаний в коллективном разуме LLM, делающая прямое обращение к разработчику все менее необходимым.

Но промпты — это только начало. Настоящая революция происходит прямо сейчас, и имя ей — ИИ-агенты.

Как там у классиков: "ИИ-агент — это уже не просто чат-бот, отвечающий на вопросы. Это автономная система, способная самостоятельно ставить цели, декомпозировать задачи, принимать решения и выполнять действия для их достижения. Агент может использовать инструменты: выходить в интернет, работать с файлами, отправлять электронные письма, подключаться к другим сервисам через API."

И вот тут-то и наступает время гуманитариев и "неайтишников" копать ямы себе и своим коллегам, создавая этих самых ИИ-агентов.

Из грёз ИИ оптимистов:

  • Юрист больше не тратит часы на поиск прецедентов. Он создает ИИ-агента, который сам мониторит судебную базу, анализирует новые законы и готовит проекты исков.

  • Маркетолог не нанимает команду для запуска рекламной кампании. Он настраивает агента, который анализирует целевую аудиторию, генерирует креативы, запускает и оптимизирует рекламу в социальных сетях, а затем представляет отчет о результатах.

  • Учитель истории создает агента-симулятора, который позволяет ученикам "пообщаться" с исторической личностью, получая ответы, основанные на реальных документах и письмах.

  • Логист в транспортной компании запускает агента, который отслеживает перемещение грузов, погоду, ситуацию на дорогах и таможне, самостоятельно перестраивая маршруты для оптимизации сроков и затрат.

А мы добавим от себя: эти самые юрист, маркетолог, учитель и логист, достигшие успеха в создании ИИ-агентов лишат работы тысячи и сотни тысяч других, менее расторопных юристов, маркетологов, учителей и логистов. Мы не должны забывать и про программистов и многих многих других белых воротничков или скорее безворотничков, реализующих через растянутую майку и видавший виды худи идеал личностной свободы, чья профессиональная судьба уже решена, несмотря на то, что они еще во всю трудятся, ходят на занятия по личностному росту, покупают продвинутые курсы чего-то там и рисуют в модных приложениях карты профессионального развития.

Один мой знакомый научный работник (биолог), отрицающий интеллект у LLM, злорадно заметил, что и хорошо, что высвободится столько людей, занимающихся непроизводительной бессмысленной работой. Я не стал расстраивать биолога и рассказывать про вал статей, описывающих, как другие околонаучные люди роют ямку и для него, пытаясь заставить LLM делать научные открытия (или хотя бы готовить для них фундамент, выполняя работу тысяч и тысяч рядовых научных сотрудников).

Дадим слово самой языковой модели:

"Происходит фундаментальная смена парадигмы. Раньше, чтобы автоматизировать процесс, нужен был программист, который писал бы жесткий алгоритм. Теперь нужен специалист в своей области (юрист, врач, логист), который может четко описать цель и дать агенту доступ к нужным инструментам. Умение кодировать уступает место умению формулировать. Техническая грамотность сменяется грамотностью методологической.

Технари-разработчики, конечно, никуда не исчезнут. Их роль трансформируется. Они становятся создателями "олимпийских богов" — фундаментальных моделей, и "титанами", которые строят платформы для создания и управления этими агентами. Но применять эту мощь, создавать на ее основе конкретные решения для бизнеса и повседневной жизни все чаще будут не они, а эксперты из других областей.

Так замыкается круг. Технологии, рожденные в недрах точных наук, в итоге передают власть в руки тех, кто лучше всех владеет самым древним и самым мощным инструментом — словом. Реванш гуманитариев свершился. И эта новая реальность обещает трансформации, масштабы которых мы только начинаем осознавать."

Ну что же, трудно не согласиться, новое прекрасное и величественное будущее уже тут. Вот только билет в него сродни лотерейному.

Всем удачи!

Написано в соавторстве с Gemini Pro 2.5

Комментарии (8)


  1. rsashka
    22.08.2025 09:19

    Только общие восторженные фразы без какой либо конкретики, да еще и написанные не на основе реального опыта, а под диктовку Gemini Pro 2.5 :-)

    промпт-инжиниринг — искусство составления таких запросов, которые заставляют нейросеть работать максимально точно и эффективно ...

    С таким же успехом можно сказать про SEO-инжиниринг. Это тоже про анализ запросов и из этой технологии выросли поисковые ИТ гиганты. Но во что это превратилось сейчас?


    1. alexey_nichnikov Автор
      22.08.2025 09:19

      с кем вы пытаетесь полемизировать с Гемени 2.5 ?
      выражайтесь яснее, "кто на ком стоял"


      1. rsashka
        22.08.2025 09:19

        Пожалуйста, вы уж сами определитесь, кто пишет и отвечает за статью, вы сами или же Gemini Pro 2.5 :-)

        Эта тема мне тоже интересна и я даже попробовал использовать вайб-кодинг в реальных проектах на С++. Однако результаты оказался не настолько радужные, как об этом пишут маркетологи (или LLM вместо них).

        И хоть положительный эфект от применения вайб-кодинга есть, но это точно не "замена технарей на гуманитариев", так как все также требуется разбираться в используемых технологиях, так как "применить все правки" будет работать далеко не во всех случаях.

        Не говоря уже про то, что формулировки промптов очень сильно зависят от используемой LLM модели, точно так же как SEO оптимизация подстраивалась под конкретную систему интернет-поиска.


  1. alexey_nichnikov Автор
    22.08.2025 09:19

    Пожалуйста, вы уж сами определитесь, кто пишет и отвечает за статью, вы сами или же Gemini Pro 2.5 :-)

    А вам хочется общаться с человеком... "Человеку нужен человек..." (из к/ф "Солярис" Тарковского по одноименному произведению Ст. Лема). Удивительно, но есть много людей, которые с удовольствием общаются с LLM, ходят к ним даже за психологической поддержкой (лично таких знаю). Может быть им было бы комфортнее, чтобы весь текст был написан Gemini 2.5 (и на вопросы чтобы он тоже отвечал). Есть даже вероятность, что вы, требующий человеческих текстов и человека для общения, скоро окажитесь в меньшинстве. Читали бессмертное: "Мечтают ли андроиды об электроовцах" Филиппа К. Дика? Мы уже там. Я по доброте душевной (и природной честности), сообщил, что в написании текста участвовала Gemini 2.5 (опять же модно и современно). А мог бы и не сообщить. И вы, как человек наивный (только наивный человек будет возмущаться в 2025 году, что текст, который он читает написан LLM), были бы уверены, что все прочитанное, набрано теплыми человеческими пальцами, стучащими по пластиковой клавиатуре...

    И хоть положительный эфект от применения вайб-кодинга есть, но это точно не "замена технарей на гуманитариев", так как все также требуется разбираться в используемых технологиях, так как "применить все правки" будет работать далеко не во всех случаях.

    Языку С++, который вы используете, уже лет этак 35 (когда я был студентом, в далеком 1995 году, это был чуть ли не последний писк программистской моды). А "технологии LLM" только 3 года. И вот вы пытаетесь доказать, что она пишет код хуже вас. Сами ваши слова и есть доказательство вашего (нашего, человеческого) поражения, вас (нас) уже заменили, хотя вы (в отличие от меня) этого и не поняли. Не переживайте, 2-5-10 лет (скорее 2, чем 10) и "применить все правки" не понадобится (без правок все будет работать). Если вы не собираетесь помирать в ближайшие несколько лет, то новый чудный мир "скатерти кодо писалки лучше вас" скушает вас, если вы не вытяните тот самый счастливый билет, про который я написал в конце текста (эту фразу набрал лично я, теплый человек из плоти и крови).

    Не говоря уже про то, что формулировки промптов очень сильно зависят от используемой LLM модели, 

    Не переживайте, "формулировку промтов" у человека тоже отберут (ОпенАИ уже сделала соответствующую приблуду). Не говоря о том, что каждой следующей модели (а они появляются каждые несколько месяцев) детализация задачи нужна все меньше. Человеку надо будет только что-то промычать, чтобы выразить свое желание (интент по научному). Впрочем Илон наш Маск (и не только он) с увлечением мастерит некий аналог Миелофона (почти как у Алисы Селезневой), чтобы и мычать не надо было. А любой козел (персонаж из того же х/ф, чьи мысли этот прибор успешно читал) мог создать свое приложение на С++ Правда успехи по разработке миелофона широкой публике пока не представлены.


    1. rsashka
      22.08.2025 09:19

      Если вам комфортнее общаться с Gemini Pro, то зачем вы генерируете LLM мусор, в виде ненужных даже вам статей на Хабре?


      1. alexey_nichnikov Автор
        22.08.2025 09:19

        Почему LLM мусор?
        Вот например, вы не знали, что ваша профессиональная деятельность с высокой вероятностью будет автоматизирована в ближайшие несколько лет (судя по вальяжному скепсису в отношение LLM) теперь знаете (даже если не сознаетесь, камешек упал на нужную чашу весов). Т. е. для вас эта статья уже не бесполезна (предупрежден, значит вооружен).

        Во вторых, вы удивитесь (судя по наивности ваших сообщений), но существенная доля статей на Хабре (боюсь под 100%) уже давно генерятся с помощью LLM (а потом правятся, а может и нет, т. к. ЛЛМ пишет лучше среднего человека). И не только на Хабре. Вот вам второе открытие о том, в каком мире вы уже живете.

        Для вас это мега полезная статья, расширяющая представления о мире. В отличие от старых ламповых статеек, с описанием опыта использования очередного фреймворка. Об этом, кстати, можно спросить у LLM (если есть впн-доступ за "цифровой занавес"), хабр для этого уже не нужен.

        Я один раз попросил рассказать про блокчейн - LLM мне выдала отчет на 30 страницах со ссылками на источники "от и до", какие тут статьи Хабра, зачем?

        Статья провокационная и судя по негативным оценкам попавшая в точку. Технари возмущены

        Ну что же...

        Их время уходит (а я ведь тоже "технарь").


  1. vesen
    22.08.2025 09:19

    Круг пока не замкнулся. И не замкнется, по крайней мере до создания полноценного AGI. А позволит ли современная методология (LLM и иже с ними) совершить этот прорыв — большой вопрос.



    1. alexey_nichnikov Автор
      22.08.2025 09:19

      Я бы не апеллировал к "полноценному AGI" хотя бы по той причине, что очень сложно определить, что это такое. Тьюринг - не последний ум в истории человечества вроде бы придумал, при этом очень хорошее, инструментальное определение в виде "теста Тьюринга", технология тест прошла, а вы ей в полноценности отказываете. Вообще философия всю историю цивилизации пытается на этот вопрос ответить, даже направление специальное придумали - гносеология, но проблему так и разрешила. Философские проблемы, как нам всем на первом курсе рассказывали не разрешимы. Кстати, по поводу того, что такое Агент, которых нынче во все стороны склоняют все кому не лень, в 50-70 ые годы прошлого века много толстых книжек написали, тоже далеко не тривиальное понятие. А нынче любого студента спроси и он конечно уверен, что суть "агентства" понимает: "Агент, ну как же!, трех уже сделал и продал, только деньги заказчик зажал..."

      Но спустимся от высоких материй к более приземленным вопросам (и технологиям). Если прямо сейчас совершенствование LLM прекратится (что очень маловероятно), то те технологии, которые есть, будут по всякому апгрейдить, вставлять в них костыли и т. п. Сейчас этим никто серьезно не занимается, потому что ты вложишься в какую-нибудь систему костылей, например, для еще лучшего кодинга, а завтра выйдет новая версия ГПТ и там все твои труды будут по умолчанию. Публика ждёт-с... и пытается осмыслить, что это такое. То есть реальное использование этой технологии еще по сути не началось, но уже, например, код они пишут "из коробки" и я и многие мои коллеги за кодом к ним ходят. А это значить, что если пару лет назад могли бы нанять джуна (или даже мидла), сегодня не наймут, а справятся имеющимися силами. Если она сможет прочитать документ и предложить проводку для 1С (а она это уже может, надо только АПИ прикруить и понять, сколько будет "глючных проводок"), то в бухгалтере Галине Сергеевне, не будет надобности, LLM может и исковое составить, только надо ей подсунуть правильные нормы права (и вот уже помощник юриста Катенька на улице) и т. д.

      А куча молодых и дерзких и не очень молодых и не очень дерзких прямо сейчас занимаются тем, что пытаются сделать такие приложения (тех самых Агентов). Т. е. не надо AGI, надо, чтобы технология могла делать то, что делают люди. Она это может, осталось только "довести до ума".

      А дальше включатся механизмы "рынка труда". И если допустим, вы работаете на должности, которая (пока) защищена, например, мастерите какую-нибудь "звезду смерти" (программный проект настолько большой, что не в один контекст не влезет с кучей интеграций и т. п.) или наоборот, таскаете компьютеры в офисе и втыкаете в них всякие провода. Вашей проблемой будет не LLM, а те люди из соседних офисов, которых она оставила без работы и которые умеют примерно тоже самое, что и вы.

      Среди них может оказаться кто-то от более талантливый и (или) более опытный или более дешевый (согласный от безысходности на половину вашей зарплаты) или и то и другое сразу. И будьте уверены, ваш работодатель со слезами на глазах, глотая горький комок, вас заменит (ну или снизит зарплату до 1/3 от текущей).

      Извиняюсь за большой комментарий

      Статья шуточная (правда не все шутки понимают), все сложности в нее упихать и невозможно и глупо, а если писать аккуратно и по пунктам, тут не статья, тут книга будет. Грустная книга (впрочем что-то такое уже написал американец по фамилии Форд (однофамилиц того самого) про угрозу роботизации, году в 2014 (во всяком случае в РФ была издана), там все хорошо изложено).