
Кратко (TL;DR): OpenCode классно задуман, но сейчас страдает от нестабильности и плохой работой с моделями/контекстом. Droid от Factory заметно стабильнее в типичных задачах и аккуратнее работает с контекстом. Но и у него есть «детские болезни» на отдельных конфигурациях CPU/Windows.
Что именно я сравнивал
OpenCode (sst/opencode) — терминальный агент с провайдер-агностичным подходом (Copilot, OpenRouter, Ollama и т. д.).
Factory Droid — терминальный агент Factory (CLI + веб), BYOK для моделей через OpenAI/Anthropic/Gemini/OpenRouter и др.
По сути оба решения очень близки, по функционалу.
Мои главные боли в OpenCode — и что нашлось в публичных источниках
Работа с «неизвестными/нестандартными» моделями и провайдерами. Я регулярно ловил «модель не поддерживается»/«модель не найдена» и прочие конфликты синтаксиса/провайдера. На GitHub таких issue — целый пласт: ProviderModelNotFoundError с OpenRouter, «requested model is not supported», проблемы с id моделей у OpenRouter, рассинхрон выбора модели и фактического запуска и т. п.
Подвисания, «молчит» и перестаёт стримить ответ. Просто замирал и переставал что-либо печатать. В issue это звучит буквально «just hangs randomly… приходится убивать процесс», иногда помогает /compact. Есть и «socket connection was closed unexpectedly».
Сессии: восстановление и странности истории. У меня после рестарта бывали «задним числом» появившиеся ответы. Прямо такой же кейс я в issue я не нашёл, но похожие есть — паники при восстановлении сессии, повторные, одинаковые ответы для нескольких запросов одной сессии, вылеты после чистки сессий. Это косвенно подтверждает нестабильность управления сессиями.
Контекстное окно и «автокомпакт». Моё ощущение: непредсказуемо и без понятного автокомпакта. В реальности у OpenCode есть /compact, но сообщество жалуется на «слишком агрессивное сжатие», теряется «личность» агента и актуальный рабочий контекст — уже просят «soft compaction» (мягкое сжатие), а ещё встречается «Session automatically compacted — Q is too eager». То есть фича есть, но она спорно работает.
Вывод по OpenCode: идея сильная, скорость развития высокая, но сейчас оно часто ломается на моделях/провайдерах и ведёт себя нестабильно в длинных сессиях. Мои ощущения подтверждаются большим количеством свежих issue за сентябрь–октябрь 2025.
Почему Droid у меня пошёл лучше
Контекст и «архитектура агента». Droid увеляет много внимания слою управления контекстом (план/исполнение, «context stack», извлечение нужного куска, меньше «замусоревания» истории лишними tool-вызовами). Это заявлено в их материалах и отражено в гайдлайнах. В реальности у меня это проявилось как более предсказуемое поведение в длинной сессии и в «прыжках» между задачами.
BYOK и модели из разных источников. Droid официально поддерживает BYOK к OpenAI/Anthropic/Gemini, OpenRouter, Fireworks, Baseten, Ollama и пр. — то есть можно подключать массу моделей «не из коробки» и пробовать их в одном и том же UX. У меня это реально работало бодрее, чем в OpenCode. Однако в отличии от OpenCode пришлось использовать CLIProxy, но это мелочи.
Публичные бенчмарки. В Terminal-Bench Droid держится в топе (в т. ч. на разных моделях), что косвенно подтверждает зрелость «обвязки» агента — не только «модель хорошая», но и исполнительная логика. Проверяем не по пресс-релизам, а по лидерборду.

Честно о минусах Droid: баги тоже есть — особенно свежие: «Illegal instruction (core dumped)» на некоторых CPU без AVX2, деградации на Windows (дубли CLI при открытии новой вкладки, замедление со временем), иногда проблемы с отображением ввода. Это быстро чинят релизами, но упомянуть важно.
Что это значит на практике
Если важна предсказуемость, сегодня я бы ставил Droid как основной инструмент и держал OpenCode как «лабораторию» для экспериментов с новыми провайдерами/фичами.
Причина — зрелость контекст-менеджмента и стабильность пайплайна, плюс реальная поддержка BYOK на широкий спектр поставщиков.
Если остаёшься на OpenCode:
1. Подбирай модели из OpenCode Zen (вроде «проверенных») или самых «ровных» провайдеров.
2. Следи за состоянием сессии; при подвисании пробуй /compact, но будь готов, что он может «потерять» рабочий контекст.
3. Для OpenRouter проверь синтаксис моделей и ограничения — часть багов связана с нотацией/доступами.
Для Droid:
1. Используй Mixed Models: тяжёлую модель (Sonnet 4.5/Opus/ GPT-5) на фазе спецификации и более быструю на имплементации — это прямо встроенный паттерн.
2. Проверь железо (AVX2), особенно на старых CPU/VM. Если вылетает — смотри последние CLI-updates/чейнджлоги.
Итоги
Оба проекта развиваются очень быстро. У Factory виден регулярный ритм «CLI Updates»/релиз-ноутсы, фиксится стабильность, добавляются фичи (OAuth MCP, улучшения Windows/PowerShell, droid exec, и т. д.). У OpenCode централизованного changelog’а я не нашёл, но по частоте свежих issue/PR видно активное движение.
OpenCode — амбициозный и удобный по идее инструмент, но на практике сейчас «плюсы убиваются» нестабильностью: подвисанием, спорное сжатие (compact) контекста и «кривые» интеграции с моделями. Требуются заметные доработки.
Droid — стабильнее в повседневной работе, аккуратнее управляет контекстом, достаточно гибкий по BYOK и подтверждён бенчмарком Terminal-Bench, хотя и у него встречаются свежие баги на некоторых системах и моделях.
Подписывайтесь на канал для получения информации от ИТ архитектора с более чем 20 летним стажем.
Bardakan
Какая стоимость использования одного и второго инструмента?
Jacov911
Я так понял это опенсорс, а модели свои
Bardakan
я про то, что человек возможно сравнивает cursor (или аналоги) за 20$/мес и какую-то из топовых моделей, стоимость которой может оказаться в разы выше
askid Автор
Оба решения тестировались на подписках от Claude (sonnet 4.5) и Zai (glm-4.6). Мог бы в обзор добавить и claude code, однако мне показалось это неправильно потому как этот инструмент заточен на одного вендора - т.е. вы не можете легко переключиться c sonnet на glm , а подключить модели от OpenRoute вообще никак.
В процессе тестирования также использовал Proxy чтобы анализировать системные промты, скажу сразу они не сильно отличаются (не так чтобы я разбирал их до глубоко), но у droid они чуть лучше структурированы.
В свое время я проводил подобное тестирования сравнивая Cline, Kilo Code, Roo code (ide) с opencode (cli). И у решений на IDE был зверский аппетит на токены.
Сейчас почти каждую неделю появляются бесплатные модели, да они иногда слабенькие, но иногда очень даже ничего. Но для работы с ними нужен агент и тут в статье я попытался объяснить почему два весьма неплохих решения не совсем одинаково работают. Потому как задачи сложные и требуют много шагов, если вдруг происходит сбой приходится объяснять модели все с нуля, а это лишнее время, токены, деньги и нервы.