Большой Дайджест Недели.
Новости. Смыслы. Инсайты.
Если кто-то считает, что социумом движет здравый смысл, он глубоко ошибается. В 21 веке обществом движет информационное давление, жажда наживы и примитивные эмоции, искусно направляемые теми, кто извлекает из этого выгоду. Я к тому, что ИИ-агенты будут работать даже если это было бы в принципе невозможно.
=> "Если хотите картинку будущего, представьте себе людей, постоянно проверяющих результаты за ИИ"
Вероятность того, что агент средней сложности успешно сам пройдет от постановки цели до результата, примерно такая же, как вероятность увидеть единорога.
В соцсетях все чаще можно увидеть мнение, что ИИ-агенты это миф, о котором мы забудем в следующем году, потому что технология не способна дать требуемый уровень точности и воспроизводимости, особенно на сложных бизнес-процессах.
Думаю, мы еще увидим много пессимизма на этот счет. И это ок. Мой опыт подсказывает, что это довольно поверхностное суждение, эти люди не учитывают разницу между "сырой" технологией и продуктом. А именно в продуктах проявляются все те возможности, о которых говорят лидеры мнений. А продукты еще в разработке. И даже когда на том или ином этапе возникают сложности, они решаются.
=> В ожидании Работокалипсиса можно провести довольно много времени. Кто-то наблюдает, кто-то участвует в процессе, так или иначе, многие сходятся во мнении, что прогноз Deloitte конца 2024 года довольно реален:
Ожидается, что в 2025 году 25% предприятий, использующих GenAI, развернут ИИ-агентов, а к 2027 году этот показатель вырастет до 50%.
И эти цифры подтверждаются свежим отчетом Capgemini, о котором подробнее в отдельной статье.
Очень удобно смотреть на то, как исполняются прогнозы тех, кто занимается этим профессионально и давно. В отличие от того же прогноза AI-2027, который, кстати говоря, на удивление тоже пока вполне себе реализуется. Взять хотя бы очередное событие на прошлой неделе, анонс AgentGPT от OpenAI. В AI-2027 это звучит так:
В середине 2025 года мир встречает Агента-0 — первое поколение помощников на основе искусственного интеллекта, которые интересны, но несовершенны и требуют постоянного человеческого контроля.
И хотя фраза, которую я где-то услышал, постоянно маячит у меня в голове: "Если кто-то это может сделать, то ИИ все равно это сделает лучше, рано или поздно", человек с ИИ-агентом представляется пока более правдоподобным ближайшим будущим, чем полная автономия.
=> Новые агентные протоколы, создают новые уязвимости для корпоративной безопасности. И это понятно, при такой скорости изменений, традиционно консервативную отрасль сетевой безопасности лихорадит. Отсутствие выделенного уровня управления для агентного трафика влечет за собой ряд существенных рисков.
=> Пока только человек способен осознать, что статистически оптимальная ситуация не означает, что она верна или мудра в текущем контексте. Ах, если бы не последние два слова (в текущем контексте), мы бы так и остались в своих глазах венцом творения. Это мой инсайт из статьи: Почему рассуждения ИИ меня беспокоят больше, чем его ошибки. Хотя она скорее об обратном, об отсутствии практической, прикладной мудрости у ИИ в текущий момент развития технологии.
=> ИИ-агенты, на которых вы все купились это ложь! Ажиотаж вокруг ИИ-агентов, которые якобы смогут полностью заменить программистов и автоматизировать сложные бизнес-процессы, является преувеличением. Для создания надежных и работающих в реальных условиях ИИ-систем по-прежнему необходимы навыки программирования и глубокая техническая экспертиза (никто и не сомневается, именно они и создают продукты). Статья закрыта под пейволл, поэтому публикую краткое резюме здесь:
Медленное внедрение в корпорациях: Вопреки заявлениям в СМИ, крупные компании не спешат массово внедрять ИИ-агентов. Это связано со значительными рисками безопасности, необходимостью изменения устоявшихся рабочих процедур и тем фактом, что многие макроуровневые задачи уже эффективно решаются существующим софтом.
Отсутствие человеческих качеств: ИИ-агенты способны обрабатывать информацию, но им не хватает человеческой интуиции, субъективного понимания и способности действовать по наитию или совершать случайные открытия, которые критически важны для инноваций в бизнесе. Со временем они могут стать излишне педантичными и негибкими в выполнении задач.
Ценность в решении проблем, а не в инструментах: Настоящая ценность заключается не в самом ИИ-инструменте, который становится все более доступным, а в стратегическом применении технологии для решения конкретных бизнес-задач и обеспечения возврата инвестиций (ROI). Компании платят за решение своих проблем, а не за модные технологии.
"Проблема гуру": Основную прибыль от тренда на ИИ-агентов получают те, кто продает идею заработка на них (например, через курсы или сомнительные платформы), а не те, кто успешно внедряет эти решения в B2B-секторе. Часто для этого используются тактики искусственного дефицита и страха упустить выгоду.
От тактики к стратегии: Простое умение пользоваться ИИ-инструментом больше не является уникальным преимуществом. Успех зависит от стратегического внедрения технологии в конкретной бизнес-нише, что требует скорее деловой хватки и консалтинговых навыков, чем просто технических знаний (и не поспоришь).
=> Хочется создавать такие системы, которые могут понимать людей, а не просто обрабатывать их язык. Основная идея заключается в том, что современные большие языковые модели, несмотря на их способность имитировать свободное общение, не обладают реальным пониманием человеческой психологии, эмоций и мышления.
Современные ИИ-агенты, построенные на базе LLM, создают «иллюзию понимания». Они превосходно справляются с семантикой, синтаксисом и распознаванием образов, но им не хватает психологического контекста, чтобы понять, как люди думают, чувствуют и принимают решения.
Это разница между ИИ, который звучит как человек, и ИИ, который понимает человека. Отсутствие такого понимания становится критическим риском, особенно в важных бизнес-процессах и при принятии ответственных решений.
Компания Receptiviti разработала технологию, которая добавляет ИИ-агентам слой психологического понимания. Эта система анализирует язык в реальном времени для выявления таких аспектов, как:
Уровень стресса.
Образ мышления (например, аналитический).
Стиль принятия решений.
Уверенность или когнитивная нагрузка собеседника.
Ключевой особенностью является анализ так называемых «стоп-слов» (предлогов, местоимений, союзов), которые традиционные системы NLP и LLM часто игнорируют. Именно эти слова содержат большую часть сигналов о психологическом состоянии человека. AI Meets Psychology: How to Build Agents that Understand People
И теперь небольшой блиц пользы по MCP-протоколу:
=> Как разработчики могут использовать агентный режим GitHub Copilot в связке с MCP-протоколом для решения реальных, сложных инженерных задач, выходящих за рамки простого написания кода в Real world MCPs in GitHub Copilot Agent Mode
=> Создатель популярной Python-библиотеки Pydantic, утверждает, что MCP-протокол может быть универсальным и более чем достаточным решением для организации взаимодействия между ИИ-агентами, и нет необходимости изобретать новые, более сложные протоколы. MCP is all you need. Samuel Colvin, Pydantic
И хотя я с ним не совсем согласен, у MCP есть ряд ограничений, и архитектурных и функциональных, выступление отличное, посмотрите.
=> Продолжает сегодня эту тему Ян Керн из Apify, который показал свое видение того, как может работать агентная экономика благодаря MCP-протоколу The rise of the agentic economy on the shoulders of MCP
Если совсем коротко, то с помощью централизованного маркетплейса MCP-сервисов, где для доступа ко множеству сервисов требуется всего один аккаунт и один API-ключ. Но в видео много и других ценных мыслей.
=> А завершает Харольд Киршнер с темой Скрытые возможности MCP.
Основной его тезис заключается в том, что большинство существующих реализаций используют MCP лишь как очередную обертку для API, в то время как полная спецификация протокола позволяет создавать по-настоящему эффективную, контекстно зависимую, коммуникацию между ИИ-агентами. В видео он довольно подробно рассказывает обо всех этих возможностях.
=> Своими глазами видел, как в одном довольно большом паблике автор просил сбросить ему хоть один пример ИИ-агента, который реально работает. Судя по всему, он этим хотел сказать, что ни у кого пока ничего не работает. Вот к примеру супер-агент Genspark и пул его микро-агентов. А где-то через полгода много чего увидим уже, только из моей ideaLAB 4-5 проектов, надеюсь, в рынке уже будет.
=> Пока лучшие открытые фреймворки для создания мультиагентных систем это AutoGen и LangGraph, а вот такие штуки как Restuck позволяют строить более надежные системы. Этот бэкенд фреймворк берет на себя все инфраструктурные задачи мультиагентной системы: обеспечивает бесперебойную работу, управляет состоянием, обрабатывает ошибки и запускает по расписанию.
***
О новых бизнес-моделях и ИИ-стартапах: Айвентор и Фред
Предыдущие материалы и выпуски дайджеста, там до сих пор много интересных инсайтов. Более 50% из них имеют длинный горизонт актуальности.