Когда работаешь с AI-агентом в большом проекте каждый день, накапливаются две усталости. 

Первая – объяснять одно и то же. В каждом новом чате заново рассказываешь, какой у вас стек, каким тестовым фреймворком пользуетесь, чем отлаживаете, что после правки нужно прогнать тесты. 

Вторая – платить сильной моделью за задачи, которым хватило бы простой: поиск файла или чтение пары классов тянет ту же дорогую модель, что и сложный рефакторинг.

В Veai 5.14 мы взялись за обе. Появился Memory Bank – агент запоминает факты о проекте между чатами. И профили маршрутизации моделей – субагенты работают на разных моделях под разные задачи. Плюс окно результатов ревью, проектные MCP-серверы и несколько изменений в интерфейсе. Разберём по порядку.

Memory Bank: агент помнит проект между чатами и перестаёт переспрашивать

Раньше каждый чат начинался с чистого листа. Агент не помнил ничего из прошлых разговоров, и специфику проекта приходилось объяснять вручную снова и снова. 

Классический пример: вы отлаживаете проблему и просите «после каждой правки прогоняй все тесты». Без памяти агент забудет это к следующему сообщению, и его придётся поправлять — раз за разом.

Memory Bank накапливает факты о проекте и ваших предпочтениях. Работает это незаметно: иногда агент что-то записывает в память, иногда читает из неё — и за счёт этого со временем действует точнее. Специально настраивать ничего не нужно, вы просто замечаете, что поправляете агента реже. Можно и сказать прямо в чате:

Запомни, что мы используем xUnit, а не NUnit.

Агент сохранит это и будет учитывать в следующих чатах. Туда же ложатся структура проекта, используемые библиотеки, код-стайл, договорённости команды.

По умолчанию Memory Bank работает в самом осторожном режиме: у агента есть инструменты читать и сохранять память, и он делает это сам, только когда считает нужным. Для тех, кому нужно больше, в настройках включается консолидация: агент периодически наводит в памяти порядок — устаревшие записи удаляет, новые упорядочивает.

Память не подгружается в каждый запрос целиком: агент читает и пишет точечно, поэтому не раздувает контекст и не тратит лишние токены и запросы.

Как включить

Memory Bank управляется из настроек: Settings → Tools → Veai → Memory Bank. На странице есть три переключателя:

  • Enable Memory Bank: главный выключатель. Включает политику памяти, индекс сохранённых знаний в контексте агента и инструменты работы с памятью. Без него остальные опции неактивны.

  • Auto-extract memories after each turn: автоматическое извлечение знаний. После ваших сообщений агент сам решает, что стоит запомнить, и сохраняет это в фоне.

  • Run periodic consolidation (dream): периодическая «уборка» памяти: объединение похожих записей, удаление дубликатов и устаревших фактов.

Как это работает

Вам почти не нужно ничего делать вручную, память работает в фоне. Под капотом происходят три процесса.

Запоминание (recall). В начале каждого ответа агент видит краткий индекс всех сохранённых знаний (заголовок и одна строка-подсказка). Если что-то из индекса относится к вашему запросу, агент сам открывает нужную запись целиком и учитывает её. Решение «заглянуть в память» агент принимает самостоятельно, никаких ключевых слов вводить не надо.

Извлечение (extraction). Если включена опция Auto-extract, после ваших сообщений (и при закрытии чата) агент анализирует беседу и сохраняет в память то, что считает важным на будущее. Это происходит в фоне; когда что-то сохранено, вы увидите уведомление.

Консолидация (dream). Если включена опция Run periodic consolidation, агент время от времени, когда вы не работаете, наводит порядок в памяти: объединяет дублирующиеся записи, удаляет устаревшее, чистит индекс. Это держит память компактной и релевантной.

Управление памятью вручную

Вам не обязательно полагаться только на автоматику, можно давать команды на естественном языке прямо в чате:

  • «Запомни, что…»: агент создаст новую запись в памяти.

  • «Обнови запись про…»: агент изменит существующую запись.

  • «Забудь про…»: агент удалит соответствующую запись (или только указанную деталь, сохранив остальные факты).

Если вы попросите забыть одну деталь из записи, где есть и другие полезные факты, агент уберёт только эту деталь, а остальное сохранит.

Редактирование файлов напрямую. Память хранится как обычные Markdown-файлы в .veai/memory/. Вы можете открыть и отредактировать их в IDE как любые другие файлы. Главный файл MEMORY.md служит оглавлением со ссылками на все записи.

Подробнее: документация по Memory Bank.

Model Routing: перестаём жечь дорогую модель на grep по коду

Между инженерами ходит поверье, что одна модель лучше планирует, другая лучше пишет код. Публичные бенчмарки на этот счёт противоречивы, но одно отличие между моделями объективно: скорость и цена. Работа тарифицируется по минутам, ставка у всех моделей одна — поэтому итоговая цена задачи зависит от времени: простые модели отвечают быстрее и выходят дешевле, сильные работают дольше, но качественнее.

Отсюда естественное желание: пусть простое действие делает быстрая модель, а сложное — сильная. Например, спланировать задачу сильной моделью, а рутинные шаги реализации отдать быстрой. Так вся задача решается ощутимо быстрее.

Для этого в 5.14 появился Model Routing. Раньше все субагенты – Code, Ask, Test, Review, Plan, Debug — наследовали модель основного чата. Теперь есть три встроенных профиля:

  • fast — лёгкий поиск и чтение файлов;

  • balanced — рутинный анализ и тесты;

  • strong — сложное ревью и отладка.

Агент сам выбирает профиль по его текстовому описанию. За каждым можно закрепить свою модель или создать собственные профили — через Settings → Tools → Veai → Model Routing или прямо в файле .veai/model-routing.yaml в проекте (глобальные профили лежат в ~/.veai/model-routing.yaml, проектный переопределяет глобальный). Если модель у профиля не указана, субагент наследует модель родительского чата — можно разбираться постепенно, ничего не сломав.

Отдельно эффект виден на ревью. 

Три субагента-ревьюера на одной модели находят меньше, чем те же три на разных архитектурах: у моделей с разным устройством разные слепые зоны, и их замечания дополняют друг друга.

Это настройка для тех, кто разбирается в моделях и хочет тонкого контроля. Остальным ничего трогать не нужно — обычный режим и так работает.

Окно ревью: находки с привязкой к строкам и кнопкой «Fix with agent»

У агента есть режим ревью: можно попросить проверить изменения, коммит или pull request. Раньше все замечания оставались текстом в чате — открыть их снова или дойти до нужной строки было неудобно.

В 5.14 появилось окно Review. Это структурированный отчёт: у каждой проблемы указаны тип и серьёзность, всё привязано к конкретным файлам и строкам, клик открывает нужное место в редакторе. Отчёт можно отсортировать по серьёзности или скопировать целиком.

Дальше два пути. 

  1. Кто хочет быстро — жмёт Fix with agent, и агент переходит во flow исправления: читает отчёт и вносит правки сам. 

  2. Кто хочет контроля — разбирает замечания вручную и отдаёт агенту на исправление только те, что считает важными. Результаты ревью сохраняются: можно закрыть вкладку, перезапустить IDE и снова открыть отчёт. Под капотом окно работает на той же инфраструктуре, что и результаты SAST-анализа.

MCP: серверы на проект, секреты в env и наконец-то бинарные ответы

MCP-серверы теперь привязаны к проекту. У full-stack-разработчика фронтенд-проект может держать серверы для Figma, а бэкенд — для Postgres, и контекст агента не засоряется лишним.

Ключи и токены выносятся из конфига в переменные окружения через плейсхолдеры вида ${env:ИМЯ_ПЕРЕМЕННОЙ} — секретов в конфиге больше нет. Отключившиеся серверы включаются массово, одним нажатием.

И главное: MCP научился работать с бинарными данными. 

Раньше плагин как MCP-клиент получал ответы сырыми байтами, и картинки или аудио видел в нечитаемом виде. Теперь бинарные ответы сохраняются в отдельные файлы, а агенту передаются ссылки на них. Это открывает новые сценарии — например, подключить MCP, который делает скриншоты экрана и управляет системой: раньше скриншоты приходили текстом, и агент не понимал, что на них. Мультимодальные модели читают такие вложения сами, а для остальных можно завести отдельный профиль вроде Image-to-Text — и связать это с Model Routing.

По мелочи: что ещё в релизе

  • Состояние сохраняется между перезапусками. Открытые вкладки чата, текущий чат, сортировки в истории — всё на месте после рестарта IDE, как вкладки в браузере.

  • Экран приветствия при пустой истории чатов вместо чёрного экрана.

  • Редактирование сообщений в очереди — отложенное сообщение можно дополнить, а не удалять и переписывать.

  • Reasoning effort «None» — полностью выключает thinking у моделей, которые его поддерживают. Раньше значение «Default» на разных провайдерах вело себя по-разному, и надёжно отключить reasoning было нельзя. Хорошо сочетается с профилем fast: получается очень быстрый режим для простых задач.

  • Управление процессами. Агент теперь не только запускает процессы, но и останавливает и перезапускает их. Нужно, когда поднимаете docker-контейнер, сервер или другое фоновое приложение и общаетесь с ним через клиент.

  • Стабильность. Поправили плавающие панели в Rider, отображение действий в Changes Overview и пустой экран при старте IDE. Ответы MCP-инструментов обрабатываются точнее, терминальные команды работают стабильнее, системный промпт стал короче.

Установить Veai 5.14 бесплатно в JetBrains IDE. А если в работе вам не хватает каких-то возможностей или сценариев, пишите нам в чат или на support@veai.ru. Такие сообщения напрямую влияют на план следующих обновлений.

Для всех, кому интересно следить за продуктом, новостями из мира AI и техниками использования AI в разработке, оставляем ссылку на наш телеграм-канал.

Комментарии (4)


  1. mst_72
    01.07.2026 18:43

    Первая – объяснять одно и то же. В каждом новом чате заново рассказываешь, какой у вас стек, каким тестовым фреймворком пользуетесь, чем отлаживаете, что после правки нужно прогнать тесты. 

    у вас нет AGEND.md??? Или это было скорее литературное преувеличение?


  1. danilovmy
    01.07.2026 18:43

    Ребят, а вы не поздновато? Это же статья из 2025? Ну заголовок уж точно оттуда, да?

    Потому как я с ноября 2025го ни разу не объяснял агенту между чатами что и как в проекте.

    Более того, индекс по памяти сессий выдаёт совпадения мгновенно, мне даже не надо говорить "запиши это"

    Ну греп по коду уже даже ленивый к марту 2026 заменил либо на граф знаний либо на расширенный ast (у меня второе, самописное)

    Ну и роутер моделей только мертвый ещё не использовал, когда начались пляски с Лимитами у антропик и запрета и на доступ с агентов.

    Кстати, автор roo плагин сказал, что закрывает проект, а он похожий немного на veai.

    В общем вы очень смело так развиваетесь. Очень хочу, что бы я ошибся и у вас все получилось!


  1. musk
    01.07.2026 18:43

    Статья устарела еще месяцев 8 назад, как минимум.


  1. mist56
    01.07.2026 18:43

    Не, ну судя по многим комментирующим на хабре, они всё ещё в 2025ом, если не раньше.