OpenCode vs Droid: тест на реальных проектах / forpes.ru

Главная
OpenCode vs Droid: тест на реальных проектах

OpenCode vs Droid: тест на реальных проектах -2

29.10.2025 12:33

askid 4 800 Источник

Кратко (TL;DR): OpenCode классно задуман, но сейчас страдает от нестабильности и плохой работой с моделями/контекстом. Droid от Factory заметно стабильнее в типичных задачах и аккуратнее работает с контекстом. Но и у него есть «детские болезни» на отдельных конфигурациях CPU/Windows.

Что именно я сравнивал

OpenCode (sst/opencode) — терминальный агент с провайдер-агностичным подходом (Copilot, OpenRouter, Ollama и т. д.).
Factory Droid — терминальный агент Factory (CLI + веб), BYOK для моделей через OpenAI/Anthropic/Gemini/OpenRouter и др.

По сути оба решения очень близки, по функционалу.

Мои главные боли в OpenCode — и что нашлось в публичных источниках

Работа с «неизвестными/нестандартными» моделями и провайдерами. Я регулярно ловил «модель не поддерживается»/«модель не найдена» и прочие конфликты синтаксиса/провайдера. На GitHub таких issue — целый пласт: ProviderModelNotFoundError с OpenRouter, «requested model is not supported», проблемы с id моделей у OpenRouter, рассинхрон выбора модели и фактического запуска и т. п.
Подвисания, «молчит» и перестаёт стримить ответ. Просто замирал и переставал что-либо печатать. В issue это звучит буквально «just hangs randomly… приходится убивать процесс», иногда помогает /compact. Есть и «socket connection was closed unexpectedly».
Сессии: восстановление и странности истории. У меня после рестарта бывали «задним числом» появившиеся ответы. Прямо такой же кейс я в issue я не нашёл, но похожие есть — паники при восстановлении сессии, повторные, одинаковые ответы для нескольких запросов одной сессии, вылеты после чистки сессий. Это косвенно подтверждает нестабильность управления сессиями.
Контекстное окно и «автокомпакт». Моё ощущение: непредсказуемо и без понятного автокомпакта. В реальности у OpenCode есть /compact, но сообщество жалуется на «слишком агрессивное сжатие», теряется «личность» агента и актуальный рабочий контекст — уже просят «soft compaction» (мягкое сжатие), а ещё встречается «Session automatically compacted — Q is too eager». То есть фича есть, но она спорно работает.

Вывод по OpenCode: идея сильная, скорость развития высокая, но сейчас оно часто ломается на моделях/провайдерах и ведёт себя нестабильно в длинных сессиях. Мои ощущения подтверждаются большим количеством свежих issue за сентябрь–октябрь 2025.

Почему Droid у меня пошёл лучше

Контекст и «архитектура агента». Droid увеляет много внимания слою управления контекстом (план/исполнение, «context stack», извлечение нужного куска, меньше «замусоревания» истории лишними tool-вызовами). Это заявлено в их материалах и отражено в гайдлайнах. В реальности у меня это проявилось как более предсказуемое поведение в длинной сессии и в «прыжках» между задачами.
BYOK и модели из разных источников. Droid официально поддерживает BYOK к OpenAI/Anthropic/Gemini, OpenRouter, Fireworks, Baseten, Ollama и пр. — то есть можно подключать массу моделей «не из коробки» и пробовать их в одном и том же UX. У меня это реально работало бодрее, чем в OpenCode. Однако в отличии от OpenCode пришлось использовать CLIProxy, но это мелочи.
Публичные бенчмарки. В Terminal-Bench Droid держится в топе (в т. ч. на разных моделях), что косвенно подтверждает зрелость «обвязки» агента — не только «модель хорошая», но и исполнительная логика. Проверяем не по пресс-релизам, а по лидерборду.

Честно о минусах Droid: баги тоже есть — особенно свежие: «Illegal instruction (core dumped)» на некоторых CPU без AVX2, деградации на Windows (дубли CLI при открытии новой вкладки, замедление со временем), иногда проблемы с отображением ввода. Это быстро чинят релизами, но упомянуть важно.

Что это значит на практике

Если важна предсказуемость, сегодня я бы ставил Droid как основной инструмент и держал OpenCode как «лабораторию» для экспериментов с новыми провайдерами/фичами.

Причина — зрелость контекст-менеджмента и стабильность пайплайна, плюс реальная поддержка BYOK на широкий спектр поставщиков.

Если остаёшься на OpenCode:

1. Подбирай модели из OpenCode Zen (вроде «проверенных») или самых «ровных» провайдеров.
2. Следи за состоянием сессии; при подвисании пробуй /compact, но будь готов, что он может «потерять» рабочий контекст.
3. Для OpenRouter проверь синтаксис моделей и ограничения — часть багов связана с нотацией/доступами.

Для Droid:

1. Используй Mixed Models: тяжёлую модель (Sonnet 4.5/Opus/ GPT-5) на фазе спецификации и более быструю на имплементации — это прямо встроенный паттерн.
2. Проверь железо (AVX2), особенно на старых CPU/VM. Если вылетает — смотри последние CLI-updates/чейнджлоги.

Итоги

Оба проекта развиваются очень быстро. У Factory виден регулярный ритм «CLI Updates»/релиз-ноутсы, фиксится стабильность, добавляются фичи (OAuth MCP, улучшения Windows/PowerShell, droid exec, и т. д.). У OpenCode централизованного changelog’а я не нашёл, но по частоте свежих issue/PR видно активное движение.

OpenCode — амбициозный и удобный по идее инструмент, но на практике сейчас «плюсы убиваются» нестабильностью: подвисанием, спорное сжатие (compact) контекста и «кривые» интеграции с моделями. Требуются заметные доработки.

Droid — стабильнее в повседневной работе, аккуратнее управляет контекстом, достаточно гибкий по BYOK и подтверждён бенчмарком Terminal-Bench, хотя и у него встречаются свежие баги на некоторых системах и моделях.

Подписывайтесь на канал для получения информации от ИТ архитектора с более чем 20 летним стажем.

Комментарии (4)

Bardakan
29.10.2025 21:18
#29036622
Какая стоимость использования одного и второго инструмента?
1. Jacov911
  29.10.2025 21:18
  #29041386
  Я так понял это опенсорс, а модели свои
  1. Bardakan
    29.10.2025 21:18
    #29041994
    я про то, что человек возможно сравнивает cursor (или аналоги) за 20$/мес и какую-то из топовых моделей, стоимость которой может оказаться в разы выше
    
    askid Автор
    29.10.2025 21:18
    #29044674
    Оба решения тестировались на подписках от Claude (sonnet 4.5) и Zai (glm-4.6). Мог бы в обзор добавить и claude code, однако мне показалось это неправильно потому как этот инструмент заточен на одного вендора - т.е. вы не можете легко переключиться c sonnet на glm , а подключить модели от OpenRoute вообще никак.
    
    В процессе тестирования также использовал Proxy чтобы анализировать системные промты, скажу сразу они не сильно отличаются (не так чтобы я разбирал их до глубоко), но у droid они чуть лучше структурированы.
    
    В свое время я проводил подобное тестирования сравнивая Cline, Kilo Code, Roo code (ide) с opencode (cli). И у решений на IDE был зверский аппетит на токены.
    
    Сейчас почти каждую неделю появляются бесплатные модели, да они иногда слабенькие, но иногда очень даже ничего. Но для работы с ними нужен агент и тут в статье я попытался объяснить почему два весьма неплохих решения не совсем одинаково работают. Потому как задачи сложные и требуют много шагов, если вдруг происходит сбой приходится объяснять модели все с нуля, а это лишнее время, токены, деньги и нервы.