Я в бешенстве. Я реально зол. Зол настолько, что хочется сносить чужие песочные замки, зарядить Дэниэлю ЛаРуссо по физиономии и поливать его грязью перед его девушкойa.
Вообще-то я не из тех, кого легко разозлить, но ситуация в индустрии достала окончательно.
Я разбираюсь в разработке софта. Занимаюсь этим 25 лет1, а если считать табулирование маркетинговых исследований на янтарных монохромных экранах — то и все 28, наверное. Да, я старый. Я задрот-программист зрелого возраста. Вся моя жизнь и самоидентификация завязаны на программирование, к лучшему это или к худшему. В моей жизни дофамин льётся по венам тогда, когда мы релизим крутые проекты.
Программирование с ИИ-ассистентами я освоил рано и оставался его фанатом до, наверное, пары месяцев назад, пока не прочитал исследование METRb. Внезапно я начал сильно сомневаться. В этом исследовании авторы выяснили, что разработчики не могут надёжно оценивать собственную продуктивность. У программистов возникало ощущение, что ИИ делает их на 20 % быстрее, а на деле он их замедлял на 19 %. Меня это шокировало, поскольку за неделю до того я кому-то ныл про свои наблюдения: мне казалось, что ИИ меня ускоряет на какие-то 25 %, и этот прирост я считал маленьким. Я ушёл всего на 5 % относительно самооценок разработчиков из этого исследования.
Ситуация припугнула. Невозможно было не задаться вопросом: а если я тоже — не могу себя оценить, как это случилось у респондентов METR? Не обманулся ли я картинкой мелькающего кода на экране? Не тратится ли на чтение и рецензирование всего этого больше времени, чем если бы я просто сделал всё сам?
Итак, я начал измерять свою продуктивность, немного модифицировав методику из того исследования. Брал задачу и прикидывал, сколько заняло бы написать её вручную. После этого я подбрасывал монетку: орёл — использую ИИ, решка — делаю сам. Потом записывал время старта и финиша. Получалась дельта, из которой я строил графики «ИИ и без-ИИ», чтобы увидеть тренды. Я делал так шесть недель подряд, всё аккуратно фиксируя. И знаете что я обнаружил?

Я обнаружил, что данных недостаточно, чтобы сделать статистически значимые выводы на сколько-нибудь вменяемом уровне. Чтобы доказать, ускоряет меня ИИ или замедляет, мне пришлось бы собирать новые точки ещё четыре месяца. Слишком уж значения идут ноздря в ноздрю.
Но отсутствие различий между группами само по себе очень интересно. Да, выборка ограниченная. Возможно, это так просто совпало. Но на данный момент факт остаётся фактом: ИИ замедляет меня по медиане на 21 %, что совпадает по результату с исследованием METR. Я могу уверенно сказать: я не вижу никакого массивного ускорения (скажем, в 2 раза) от использования ИИ-инструментов для программирования. Если бы оно было, результаты были бы статистически значимыми, и исследование уже можно было бы закрывать.
Это очень разочаровывает.
Я бы хотел, чтобы мечта о программировании с ИИ-ассистентами была реальностью. Хотел бы материализовать в коде каждую дурацкую идею, что у меня когда-либо была. Хотел бы в понедельник сделать приложку для обучения грифу, в среду — тренажёр корейского, а в субботу — игру. Я б это всё зарелизил. Я бы затопил мир потоком ширпотребного трэшового софтаc, какого мир ещё не видел. Если бы ИИ действительно усиливал продуктивность, я бы так точно сделал.
Однако, как выясняется — а я собрал про это много данных — ИИ не повышает производительность труда не только у меня, он не повышает продуктивность ни у кого. И я сейчас это докажу.
Но сперва давайте поглядим, какими сильными и популярными словами рекомендуют продуктивность от ИИ. Слоган Cursor: «Создан, чтобы сделать вас экстраординарно продуктивными». У Claude Code: «Пишите ПО лучше и быстрее». У GitHub Copilot: «Делегируйте как профи». Google утверждает, что их БЯМ делает разработчиков компании на 25 % быстрее. OpenAI публикует свои собственные исследования и громкие заявления об эффективности программирования2. И даже сами разработчики не лучше: 14% утверждают, что видят «десятикратный» рост производительности труда благодаря ИИ3.
Рекламные слоганы были бы не так важны, если не максимальная серьёзность темы. Технические руководители по всей отрасли поддаются FOMOd: конкуренты имеют колоссальный прирост эффективности, а мы этого не получаем! Подобное заставляет ребрендироваться в компании жанра AI-First4, оправдывать увольнения новообретёнными нарративами о продуктивности и занижать зарплаты разработчиков, исходя из предположения, что ИИ фундаментально изменил уравнение ценности.
И всё же, несмотря на максимально широкое внедрение, какое только можно вообразить5, эти инструменты не работают.
Мой довод: если так много разработчиков стали экстраординарно продуктивными благодаря этим инструментам, где же поток ширпотребного софта? Нашему взору должны предстать приложения всех форм и размеров, видеоигры, новые сайты, мобильные приложения, SaaS — нас должно утопить в изобилии. Мы должны были бы жить в разгаре инди-революции в софте. Мы должны были бы видеть 10 000 клонов «Тетриса» в Steam.
Просто подумайте. Вы много знаете о программировании с ИИ-ассистентами и его широком внедрении. Если я покажу вам графики мировых релизов софта, какую форму вы ожидаете увидеть? Несомненно, устремившуюся вверх и вправо экспоненту, поскольку внедрение ИИ набирает обороты, и софта пишут больше?
Чтобы собрать данные для этой статьи, я потратил много денег и недели времени, в некоторых случаях обрабатывал десятки терабайт. Надеюсь, вы оцените, насколько эти разочаровывающие графики слабо изменяются по всем крупным сегментам разработки.





Самое интересное в этих графиках — чего на них нет. На них нет внезапного всплеска или «клюшки» скачка. В лучшем случае они плоские. Нет вспышки трэшового софта. Нет внезапного инди-бума после 2022 и 2023 годов. По этим графикам вы не сможете сказать, когда код стали писать с помощью ИИ-ассистентов. Базовая посылка ошибочна. Никто не релизит больше, чем раньше.
Влияние на человеческие жизни огромно. Людей увольняют за то, что они недостаточно быстро осваивают эти инструменты6. Люди сидят на нелюбимой работе, потому что боятся, что в другом месте будет хуже. Люди тратят кучу времени, пытаясь прокачать навыки промптинга, у них не получается, и они чувствуют себя ещё хуже.
Что это за хрень происходит?
Итак, давайте разберёмся. Если вы разработчик и чувствуете давление срочно внедрять эти инструменты — давление от менеджера, коллег или общего отраслевого психоза, — доверьтесь интуиции. Если инструменты кажутся корявыми, если они тормозят вас, если вас сбивает с толку, как другие достигают такой продуктивности, — не надо думать, что с вами что-то не так. Ваш опыт подтверждается данными. Вы не отстаете от остальных, если продолжаете работать так, как у вас получается. Если хватит смелости, покажите эти графики своему менеджеру и спросите, что он о них думает.
Если выносить отсюда какие-то выводы:
Разработчики выпускают не больше, чем раньше. И это единственная метрика, которая важна.
Если кто-то — будь то глава вашей компании, техлид или какой-нибудь умник с Reddit — утверждает, что благодаря ИИ повысил производительность труда на порядок, это почти наверняка неправда. Требуйте предъявить пруфы или катиться к чертям.
О да, я знаю, как бывает в Интернете. Прекрасно знаю, что многие из вас, лопухов, скажут, могу всё угадать. Так что давайте сразу к делу:
-
«Ну если бы ты научился нормально промптить, ты тоже стал бы 10x-инженером, как я».
Посмотрите на данные. Нет никаких новых 10x-инженеров. Если бы были — если бы 14 % тех, кто объявляет себя 10x-инженером за счёт ИИ, действительно были таковыми — это более чем вдвое увеличило бы мировую выработку нового софта. Этого не случилось. А ты, лично ты, покажи 30 приложений, которые ты сделал в этом году. Я не собираюсь это обсуждать без пруфов.
-
«Ну это новая технология, в неё так много вложено, и нужно время…»
Да, в эти инструменты вложены миллиарды долларов. И миллиарды долларов будут вкладывать и дальше. Проблема в том, что ИИ-продукты продают и дают им оценки (в том числе затрагивающие реальные жизни людей) так, будто эти продукты работают уже сегодня. Не повторяйте мне мантру, что в будущем всё улучшится. Сейчас сентябрь 2025, ИИ-ассистенты существуют уже годы, но они всё ещё сосут. Наверное, когда-нибудь сосать перестанут, но нам потребуется объективное макродоказательство их влияния на реальную скорость релиза продуктов.
-
«Ну сейчас ИИ помогает так себе, но если не освоишь ИИ, то останешься позади».
Нет никаких индикаторов, что промптинг трудно освоить. В GitHub про Copilot говорят, что пользователи поначалу принимали лишь 29 % предложенных подсказок кода. Кстати, это само по себе удивительно откровенное признание неэффективности — зачем это публиковать? Дальше GitHub пишет, что программисты естественным путём нарабатывают навык, поэтому за шесть месяцев показатель растёт аж до 34 %. Видимо, полгода опыта улучшает навыки промптинга на 5 %e.
-
«Ну качество растёт, возможно. Просто проекты просто не релизятся быстрее…»
Бред какой-то. Мы все знаем, что отрасль откатилась по качеству кода минимум на десятилетие. Софт уже почти никто не тестирует. В последний раз я слышал фразы «continuous improvement» или «test-driven development» до ковида. Вы же не хуже меня знаете: если бы был инструмент, делающий людей 10x-программистами, нас бы уже утопило в ширпотребном трэшаке.
-
«Ну просто сейчас всё делают на технологиях веба, и людям уже не так важны отдельные домены; все сидят на поддоменах по типу Vercel».
Да ладно. Люди обожают свои личные домены.
-
«Ну зато домены в .ai выросли на 47 % в этом году…»
Да, потому что все стартапы запивотились в AI. Это единственный способ выжать деньги из FOMO у инвесторов. А что, общее количество доменных имён выросло беспрецедентно? Нет. Посмотрите на график новых доменов.
-
«Ну если бы ты был настоящим инженером, ты бы знал, что бо́льшая часть разработки — это не написание кода».
Это верно только в больших корпорациях. Когда ты один — то есть ты и стейкхолдер, и разработчик — у тебя нет митингов. Вы мне хотите сказать, что люди перестали шипить что-то в одиночку? Что люди перестали заводить новые проекты на GitHub, хотя им чешется поработать? Как вообще создание софта может не предполагать написание кода?
1. 28 лет опыта — это примерно 55 000 часов. Мне показалась забавной эта метрика. ↑
2. Сэм Альтман говорит, что с ИИ-программированием разработчики теперь «в 10 раз продуктивнее». И что мир хочет «в 100 раз, может, в 1000 раз больше софта». (С этим я согласен). Альтман также прогнозирует, что программисты «будут зарабатывать втрое больше» в будущем. ↑
3. 78 % использующих ИИ разработчиков сообщают о росте продуктивности, при этом 17 % из них (13–14 % всех опрошенных) заявляют о «десятикратном» увеличении производительности труда благодаря ИИ. ↑
4. Забавно, что ни одна из технологических контор, которая заявляет себя как «AI-First», не обучает, как с ИИ разрабатывать программы на порядок быстрее. «Экспериментируйте и разбирайтесь сами» — вот типичный совет. Видимо, официальные гайды по промптингу (1, 2, 3) не сто́ят и выеденного яйца, потому что не работают. Улавливаете диссонанс? ↑
5. 60 % разработчиков сообщают, что пользуются ИИ-инструментами для программирования ежедневно, 82 % — как минимум еженедельно. ↑
6. На прошлой неделе глава Coinbase уволил инженеров, которые отказывались пользоваться Cursor или Copilot. ↑
Примечания переводчика
a. Дэниэль ЛаРуссо — главный герой кинофраншизы «Парень-каратист» (The Karate Kid). В данном случае перечисляются действия, которые совершил бы оппонент Дэниэля в фильме 1984 года, чем автор дополнительно ещё раз обозначает свой возраст. Тем не менее это неточная отсылка к сюжету: в фильме Джонни Лоуренс не ломает замков из песка, в сцене на пляже он разве что бросает радио на песок. ↑
b. Также это исследование хорошо описано на Хабре. ↑
c. Здесь и далее автор использует конкретный термин shovelware, который в русском языке используется редко. К примеру, на Хабре всего два упоминания термина в статьях. ↑
d. FOMO — Fear Of Missing Out, страх упустить тренд или возможность. ↑
e. Здесь оговорка, поскольку значение выросло на 5 процентных пунктов или на 17,2 %. ↑
Об авторе

Майк Джадж (mikelovesrobots) — американский инженер-программист и руководитель разработки из Сиэтла. Джадж работает директором по разработке в студии Substantial с 2021 года. Он руководил командами, занимался полным циклом проектов и, в числе заметных работ, курировал мобильный порт популярной карточной игры Exploding Kittens. Как инди-разработчик Майк создавал собственные проекты, в том числе учебное приложение Morse Toad (азбука Морзе) и шутливое Places I've Pooped.
Cреди любимых технологий Джаджа — TypeScript/JavaScript, React/React Native, Ruby on Rails, C#, PostgreSQL/GraphQL, Python.
Комментарии (17)
NimuraF
07.09.2025 16:49Я уже давно уверен, что всё это супер многоходовочка по продаже курсов по написанию крутых промптов для несведущих. Зарабатывают во время кризиса очередным мировым разводом, классика уже.
panzerfaust
07.09.2025 16:49Прежде чем создавать себе идола гиперпродуктивности, следует вспомнить, что софт не самоценен и в основном пишется под нужды человека. Если писать в N раз больше софта, то нужда в нем вырастет в N раз?
randomsimplenumber
07.09.2025 16:49Скорее упадет в N раз. Сколько аналогов notepad уже существует? Если их число удвоится- много ли кто удалит gedit и ради чего?
Zoolander
07.09.2025 16:49Потому что сюрприз - собственно написание кода забирает меньше времени, чем все остальное в создании софта.
К примеру, есть ловушка рефакторинга - когда ты постоянно переписываешь код, хотя он уже работает
Я знаю одного парня, который строчит сейчас с помощью курсора огромные рефакторинги на сотни строы, хотя.... приложение работает и так. Новые фичи не появляются. Нейронка просто стала ловушкой для ума - он тратит время на то, что давно пора признать болезнью - "сделать код наконец-то по красоте"Dhwtj
07.09.2025 16:49На нейросети хорошо учиться, проверять.
Но работать... Не всегда
Ну будешь же ты вечным джуном
sibirier
07.09.2025 16:49Посмотрите на данные. Нет никаких новых 10x-инженеров. Если бы были — если бы 14 % тех, кто объявляет себя 10x-инженером за счёт ИИ, действительно были таковыми — это более чем вдвое увеличило бы мировую выработку нового софта. Этого не случилось.
Но ведь разработка из написания кода состоит процентов на 5-10. Изредка около 15-20%. А, кажется, "ИИ" ускоряет только эту часть (возможно, ошибаюсь).
Так вот: 0.1*10+0.9*1 = 1.9 раз ускорение работы было бы.
0.14 (которые якобы 10х программисты)*1.9+0.86*1 = 1.126.
То есть ускорение было бы процентов на 12 больше, если 10х-программистов 14% и если доля кода у них 10% от времени разработки.
Допустим они чисто кодеры, а вся остальная команда (обычно это человек 4-7) прекращает разрабатывать и подсказывает и согласует требования, тестирует (в т.ч. продакшн тестирования, типа производительности или стабильности), дебажит, готовит архитектуру и всё такое. То 10 (вся производительность ускорена)*1/5 (команда из 5 человек, один 10х кодер) + 1*4/5 = 2.8. Если такие 10х программисты распределены равномерно (то есть по одному на команду), а команды, допустим, везде в среднем из 5 человек, то, получается, 14/20 команд ускорятся в 2.8 раз, а 6/20 останутся х1. Считаем: 0,7*2,8+0,3*1= 2.26. И, если верить автору, если учесть, что ускорения релизов в 2 раза не случилось, значит команды устроены менее эффективно. Или опрос был на уровне "100% опрошенных на нашем сайте подтвердили, что пользуются интернетом".
Это я к чему: даже если эти лихие формулировки чуть развернуть (и в итоге придти к тем же цифрам; хотя я ожидал оспорить цифры, но получилось только подтвердить), то да - разработка эффективнее не стала, бум не случился.
В общем, серебрянной пули опять пока нет, как обычно)
Пока что "ИИ" выглядит как "лошадь быстрее", нежели ДВС. Если даже и быстрее, что не факт, как мы видим из статьи (если там было всё грамотно исследовано; не слишком внимательно вчитывался).
С другой стороны, если ускорять все этапы (сбор требований, аналитика, согласования, проектирование, программирование, дебаг, тестирование, приёмка, документации, доставка кода и продукта (CI/CD)), то может быть и случится ускорение на несколько процентов.
Но даже если ускорить каждого участника, то человеческий фактор всё равно останется: недопонимания, забывчивость, наложение графиков для обсуждений (люди однозадачны (если без потери качества)), болезни, отпуска, усталость и так далее. И итоговое ускорение всё равно будет процентов на 5, даже если в среднем каждого ускороили раза в 2. А сокращать кол-во людей (чтобы уменьшить проблемы коммуникаций) = увеличивать входные требования к компетенциям работников, а это экспоненциальный рост оплаты труда (полезность при этом может расти чуть больше линейной. В любом случае, не больше квадратичной (ИМХО, взял из головы/опыта)). А экспонента больше квадрата. То есть может это и будет быстрее, но при этом будет сильно дороже.
Короче, думаю, даже линейное ускорение каждого участника рынка всё равно не даст экономию или феноменальную скорость разработки. Обычно это происходит с внедрением скачкообразно меняющих что-то технологий. То есть когда множится профит, но не множатся ошибки). "ИИ" (ИНС/LLM) пока что больше множит ошибки (и плодит новые), чем ускоряет профит.
411
07.09.2025 16:49Уже писал это где-то, но ещё раз напишу - сила этих тулз в том, что они могут работать в бэкграунде, пока ты занят другими задачами.
В итоге ты можешь условно работать над основной задачей в форграунде без ИИ или с малой его помощью и делать 1, максимум 2 задачи в бэкграунде. Либо делать 4-5 задач параллельно все с помощью ИИ, постоянно между ними переключаясь.
И то и то при правильном подходе увеличивает скорость существенно, но естественно имеет предел. При этом фолбэк на ручное решение проблемы обычно возвращает твою скорость на обычную. То есть так или иначе ты должен получать ускорение.
Все, при этом, пытаются получить ускорение на 1 задаче. Что иногда работает, но в основном в тех случаях, когда для решения задачи нужно работать с непривычными вещами при условии, что ИИ знает, как их писать. Естественно, если не знает, будет скорее всего выброшенный код. Поэтому ещё один навык тут - правильно оценить, будет ли выгода от использования ИИ в этой задаче и какие части надо делегировать.
Так что проблема в том, что многие пока что просто не разобрались и не оптимизировали свои процессы и пытаются действовать по-старому, используя новые тулзы. Это в общем сравнимо с тем, что на самолёте пытаться ехать по земле.
olegl84
07.09.2025 16:49Лично для меня ассистенты вроде Github copilot не работают, только мешают. А вот OpenAI codex реально работает и повышает эффективность
VitalyOborin
07.09.2025 16:49Это похоже на историю со строительством домов. Многие люди, далекие от строительства, думают, что самая дорогая и сложная часть дома - это стены. Их все видят, они большие, объемные. Но в стоимости дома они хорошо если 10% времени и трудозатрат. Именно по этой причине, кстати, многие проекты по автоматизации строительства стен (печать из бетона и прочие) загибаются, руками сделать всё еще дешевле и быстрее. Также и с разработкой ПО - написание кода - это только часть приложения. Еще есть идея, проверка гипотез, юнит-экономика, архитектура, аналитика, тестирование, деплой, переписывание кода, борьба с техдолгом и много чего еще. И про это всё очень часто забывают, а без всех этих частей нормальное ПО (что-то сложнее примитивной игры или одностраничного лендинга) сделать достаточно сложно. Пока уровень работы ИИ - это помощь. Да, разработка поменялась, сегодня решение проблемы - это не 50 вкладок со stackoverflow, а разбор проблемы в чате с ИИ. Ревью предложенного кода в любом случае быстрее написания кода вручную. Ни о каких х10 ускорении конечно речи быть не может, но какой-то прирост все равно есть. Он на прикладном уровне, мы стали писать код лучше и быстрее, если до этого умели писать хороший код быстро. Но это лишь отдельный этап SDLC, написание кода также как и стены - большой и видимый объем, но далеко не весь дом.
maximlubyanov
07.09.2025 16:49Повторю свой вопрос к all из другой темы...
Давайте проведем блиц-опрос: Рост продуктивности при использовании LLM связан с более легким и быстрым выходом из прокастинации - согласны да/нет?
WASD1
07.09.2025 16:49Крайне интересные графики.
Был уверен, что волна инди-разработки если не накатилась, то вот-вот накатится.
Типа соцсети для выпекателей пирожков или телеграмм-бота для страюающих от диабета.
ASenchenko
07.09.2025 16:49Мне не очень понравился один момент, который возможно не совсем верно переведён.
Автор статьи (не перевода) заявлял что работает с ИИ довольно давно. Но при этом решил делить задачи "по монете“, то есть подкидывая нейронке с высокой вероятностью в том числе те задачи, в которых ИИ заведомо слабы.
Думаю, результат был бы иным, если бы человек уже на опыте скармливал нейронке только то, что она гарантированно сделает отлично. По крайней мере в реальной практике такой подход выглядит разумным
VNAg
07.09.2025 16:49Мне кажется было бы полезно сопоставить с прибылью компаний. Быть может там есть какой-нибудь значительный рост? Тогда ожидания связанные с ростом продуктивности от технологий ИИ по-видимому насчёт именно прибыли, а не чего-либо другого. Если один программист с ИИ ассистентом может делать столько же, сколько два без него, то одного можно уволить, половину его зарплаты оставить себе, а половину отдать оставшемуся программисту. Отсюда же и объяснение почему нет никакого прироста конечной продукции - это и не нужно, перенасыщать рынок. Нужно (владельцам бизнеса) максимизировать прибыль.
Если же повышения продуктивности программистов действительно нет, то сокращение штата должно привести к падению темпов выпуска новой продукции и падению прибыли.
Indemsys
07.09.2025 16:49Есть тут лукавства.
Claude Sonnet в качестве агента стал нормально кодить всего несколько месяцев назад.
Функция делегирования агенту в облака на сам GitHub скажем в GitHub Copilot появилось вообще пару дней назад.А главное - агенты еще очень медленно работают. Ожидание в пару минут на простые запросы просто тормозит работу. Никогда не угадаеш когда он тормознет.
Да и сборщики еще очень медленные.Ну и наконец, промптинг не имеет никакого значения.
В скорости разработки имеет значение подстройка агентских инструментов, инструкций и MCP серверов под свой рабочий процесс. Именно от этого зависит сколько бесплодных попыток что-то сделать будут тратить агенты и в какой бюджет это выльется.
Я считаю что ускорение с агентами реально достигает 5-10 раз. Но при условии отлаженного рабочего процесса и дорогого плана.
soymiguel
Какие янтарные табулирования в монохроме маркетингов в 1997 году (28 лет назад, год выхода Фоллаута и Кваки 2)?
Кто здесь? Что вообще происходит? За что?