Последнее время гоняю разные кодовые агенты во всех позах и форматах на моём домашнем *Claw-подобном харнес Coddy Agent, практикую как интеграции разных кодовых агентов и апишек в агента для вайбкода, так и разработку кода этого агента разными инструментами, то бишь вайбкожу его ими.

Между делом решил разобраться с экономикой и ценами, какие на рынке есть подписки, сколько они стоят и где есть специальные тарифы для кодовых агентов, которые можно было встроить в свой харнес, по ходу дела получился данный обзор.

Бай зе вей, цены актуальны на Июнь 2026 года, если вы из будущего, то скорее всего какая-то часть информации уже устарела.

Сразу главный вопрос.

Можно ли воткнуть в свой агент Codex по подписке ChatGPT или Claude по Pro/Max - и не платить за каждый токен? Всё упирается в две вещи - кто продаёт вам модель и как ваш агент ходит к ней в API, потому что долгоживущий *Claw-харнес в режиме 24/7 жрёт квоту аки спортсмен на массе и провайдеры это считают.

Есть два основных вида подписок на подходящие для Claw-харнес модельки:

  • Специальный агент и Code-подписка - платишь фикс, а провайдер даёт специальную апишку только для кодового агента со своими лимитами, к агентам мы через ACP подключаемся, это у нас Anthropic ClaudeCode, OpenAI Codex, Cursor, MiniMax, Kodacode, Qwen Code, Z.AI Code, отчасти KimiCode и OpenCode.

  • Только API - обычно платишь за сколько потратил, но иногда бывает пакеты с квотами, к примеру Neuraldeep, OpenRouter, DeepSeek, а ещё Kimi если через апишку ходить.

Нюанс в том, что границы размытые, один провайдер часто поддерживает два разных API с разными ключами и эндпоинтами, так у Moonshot/Kimi, у Alibaba/Qwen и некоторых других.

Весёлые картинки

Сравнение подписок - вход
Сравнение подписок - вход
Сравнение подписок - лесенка
Сравнение подписок - лесенка

Ковальски, варианты?

Cursor - тот самый бейслайн

Агент Cursor это отдельный харнес в формате IDE, есть вариант установки в виде CLI тула с поддержкой ACP и плагины для VS Code / JetBrains.

Цены в долларах: Hobby бесплатно (урезанные Agent и Tab), Pro за $20 мес ($16 если за год оплатить), Pro+ $60 мес (лимиты 3x от Pro), Ultra $200 мес (10x) и командный Teams $40 мес за пользователя.

Оплата долларовой картой.

OpenAI Codex - тут проще всего

Редкий случай, когда вендор сам идёт навстречу харнесоводам, так как OpenAI официально разрешает использовать OAuth для внешних кодовых агентов. Подписка Plus/Pro покрывает Codex внутри квот ChatGPT, без классической оплаты за токен. Они даже плагин для Claude Code выкатили - кросс-экосистема им банально выгодна.

Если нужен харнес плюс фикс за месяц, то Codex по ACP сейчас эталон, бейслайн для любого сравнения агентов на подписке Plus $20/мес.

Оплата долларовой картой.

Anthropic ClaudeCode - с нюансом

В начале 2026 Anthropic прижала consumer-подписки в сторонних агентах, и харнесы попали под раздачу первыми. Причина в том, что бесконечные agent loop’ы не влезают в экономику тарифа за $20–200.

API-ключ был легален всегда, постоплата за токены. OAuth от подписки технически работал, но политически - серая зона, отдельные аккаунты ловили бан. Локальный claude -p стал компромиссом: харнес дёргает официальный CLI, и Anthropic видит “свой” клиент. В апреле подписка перестала покрывать агента “бесплатно”, usage уехал в extra usage по API-тарифам, а с 16.06.2026 выкатывают отдельный пул Agent SDK credits на все кодовые агенты.

По деньгам ориентир такой: API за 1M токенов - Haiku 4.5 $1/$5, Sonnet 4.6 $3/$15, Opus 4.7 $5/$25 (батч −50%, кэш до −90% на чтение). Так что Claude в харнес - да, но считайте как за API или изобретайте костыли вида claude -p или claude-code-acp.

Оплата долларовой картой.

Moonshot KimiCode - есть Code, есть API

У Moonshot фактически два провайдера. Есть Kimi API, даёт доступ к моделям с длинным контекстом. И есть Kimi Coding - авторизация OAuth через kimi login, это агентный кодинг. Ключи не взаимозаменяемы, эндпоинты и модели разные. Для Coding-плана живёт community-плагин с нормальным OAuth.

По цене для харнеса норм будет либо подписка Allegretto $39 (Kimi Code 5x), либо API по факту: K2.7 это $0.95 / $4.00 за 1M, кэш-хит вообще $0.19. Политика заметно мягче anthropic’овской, жёсткого запрета на испльзование KimiCode по ACP в своих харнес нет.

Оплата долларовой или юаневой картой.

MiniMax - кодовый агент на Coding Plan

Документация прямо относит MiniMax к провайдерам с подпиской OAuth, рядом с Codex. На практике на отдельных версиях gateway ловятся 401 и баги сохранения авторизации, issue-трекера на гитхабе вам в помощь.

Token Plan начинается с $10/мес (Starter, 1500 запросов / 5 ч), Plus $20, Max $50, есть highspeed-линейка дороже, при годовой подписке дают два месяца в подарок.

Оплата долларовой или юаневой картой.

Alibaba Qwen - Coding Plan как отдельный продукт

В одном плане сразу несколько семейств моделей - qwen3.6-plus, kimi-k2.5, glm-5, MiniMax-M2.5.

По деньгам самый дешёвый вариант это Lite за $10/мес, и сразу несколько семейств моделей доступны из коробки. Нюанс: формально Lite закрыли для новых подписчиков с 20.03.2026 (старые спокойно продлевают и апгрейдятся), так что свежему аккаунту может остаться только Pro $50/мес (90k запросов в месяц). Если $10-тариф у вас ещё доступен - это лучшая цена за мультимодельный план в подборке.

Оплата долларовой или юаневой картой.

Z.AI GLM - зайки

Платформа Zhipu (жипу), они же Z.AI, предоставляют тарифы под семейство моделей GLM, помимо моделей в подписке ещё будут тулы поиска в сети аля Tavily и другие приятные мелочи.

GLM Coding Plan считается помесячно (или дешевле кварталом −10% / годом −20%). Тарифы: Lite $18/мес (GLM-5.1 и младшие, 20+ кодовых тулов), Pro $72/мес (5x лимыты от Lite) и Max $160/мес (20x, выделенные ресурсы в пик).

Промо вроде $3 - это уже история, хотя могут и выкинуть под какой-нибудь эвент, но ориентируйтесь на текущие $18 / $72 / $160.

Оплата долларовой или юаневой картой.

Xiaomi MiMo - шаоми решили порадовать

Не так давно Xiaomi взяла кодовый агент OpenCode, навесила свою память и режимы и зарелизила MiMo Code под MIT - ставится как OpenCode. По дефолту там выбрана MiMo-V2.5-Pro, MoE моделка, которая на их же (хехехе) agentic-бенчмарке обходит Claude Code на сверхдлинных задачах в 200+ шагов.

Что важно для нас: в харнес модельки MiMo заходит по API-ключу (как и в Claude Code/OpenCode), без отдельного OAuth. Подписка Token Plan бывает трёх видов: Lite ~6/мес, Standard ~16, Pro ~50, Max ~100, первая покупка −12%. По API дёшево: MiMo-V2.5 $0.14 / $0.28 за 1M (Pro - $0.435 / $0.87), кэш почти бесплатный. По цена/качество на код - один из самых любопытных вариантов на сегодняшний день.

Оплата долларовой или юаневой картой.

DeepSeek - только API

Специального кодового агента и подписки под него у DeepSeek нет вообще, зато есть OpenAI-совместимый API и понятная политика - платишь за токены, гоняешь где хочешь.

Модель Flash стоит $0.14 / $0.28 за 1M (кэш-хит вообще копейки), Pro - $0.435 / $0.87, контекст до 1M, для хомлабы и всяких автоматизаций это пожалуй лучший вариант, хотя и с нюансами, так как с недавних пор конкурент в лице MiMo появился.

Оплата долларовой или юаневой картой.

OpenCode Go - агрегатор, если лень выбирать

OpenCode Go - это кодовый агент и подписка-агрегатор: $5 первый месяц, дальше $10/мес, и за эти деньги один ключ на ~15 открытых моделей сразу - GLM-5.1, Kimi K2.6, MiMo-V2.5, MiniMax M2.7, Qwen3.6, DeepSeek V4 и компания.

Заявлено, что модели “works with any agent”, плюс можно встроить агента по ACP в свой харнес. По сути покупка такого тарифар это способ не городить десять ключей, а взять пачку топовых китайских опенсорсных моделей оптом и переключаться между ними, ну или же если не хочется связываться с OpenRouter. Для экспериментов и сравнений заходит отлично.

Оплата долларовой картой.

OpenRouter - западный хаб моделей

OpenRouter - супермаркет на 300+ моделей от всех подряд: Anthropic, OpenAI, Google, DeepSeek, Mistral, xAI, китайцы - всё через один OpenAI-совместимый ключ. Цены у каждой модели свои, OpenRouter отдаёт их по тарифам самих провайдеров без накрутки на токены, зарабатывает на комиссии (~5.5% при пополнении баланса картой и 5% на запросах сверх 1M в месяц). Есть и десяток бесплатных моделей с рейт-лимитом, чтобы потрогать.

Пакетов-подписок как таковых нет - это чистый pay-as-you-go: кидаешь бабос на счёт и тратишь по факту. Фикса “заплатил $20 и забыл” тут не будет, считайте как за API.

И главный затык для нас: без “туннелей” OpenRouter из России не открывается, российские учётки иногда банят, да и оплата мимо российских карт. Штука мощная, но для домашнего always-on харнеса в наших условиях - ну такое, но для фолбэка сойдёт.

Оплата долларовой картой.

Kodacode - российский кодовый агент

У Kodacode есть расширения для VS Code и JetBrains, свой CLI с поддержкой ACP, есть режимы Chat/Edit/Agent, OAuth без “туннелей”.

Тарифы в рублях, при оплате на 3 месяца −10%, на год −20%. Есть Free (0 ₽, но со 2-го месяца лимиты заметно режут), дальше Pro 1 590 ₽/мес, Pro+ 4 790 ₽/мес (3x лимиты плюс пакеты внешних моделей вроде GPT и Sonnet) и Ultra 15 900 ₽/мес (10x). Важный нюанс по счётчику: считаются запросы на модель, и в Агенте каждый вызов тула - это тоже запрос (автокомплит при этом безлимитный).

Оплата по СБП или рублёвой картой.

Промокод KODA-FQ9XHTM9 от создателей Koda.

NeuralDeep - российский хаб

Ещё из отечественного, NeuralDeep - это LLM-прокси и OpenAI-совместимый API в России, агрегатор моделей, скилов и MCP-серверов, созданный Валерием @neuraldeep. В харнес по апишке заходит отлично, ограничений нет. Модели крутятся на своих GPU в России, плюс self-hosted и enterprise-развёртывание по запросу.

И по тарифам тут интересно то что, оплата по реквестам, а не за токены как у других провайдеров.

Есть тарифы Free (1x базового объёма) - не демка, реально все on-premise модели доступны через API, но с лимитами. Ещё есть тариф Coder - 1 590 ₽/мес (3x от лимитов Free), это чистый API специально под агентов и интеграции. Starter - 2 500 ₽/мес (5x), лимиты повыше, плюс агент Drift. И тариф Pro - 4 900 ₽/мес (10x), имеет наивысший приоритет, модель Kimi без урезания, доступны все сервисы.

Одной подпиской берёшь и провайдера моделей и мини-харнес в комплекте (Drift Agent) - в реалиях нашей страны самое оно.

Оплата рублёвой картой или СБП.

Чо почём - одной таблицей

Вендор и продукт

Тип

Вход

Как подключить к своему харнесу

NeuralDeep

агрегатор

Free / Coder 1 590 ₽ / Starter 2 500 ₽ / Pro 4 900 ₽

по API

Koda Kodacode

кодовый агент

Free / Pro 1 590 ₽ / Ultra 15 900 ₽

через ACP

OpenCode

кодовый агент / агрегатор

1-й мес $5, потом $10

через ACP

Cursor

кодовый агент

Free / Pro $16–20 / Ultra $200

через ACP

OpenAI Codex

кодовый агент / API

Plus $20

по API или через ACP

Antropic ClaudeCode

кодовый агент / API

Pro $20

по API или через ACP

Moonshot KimiCode

кодовый агент / API

app 19–39 / API ~1/1M

по API или через ACP

DeepSeek

API

$0.14 / $0.28 за 1M (Flash)

по API

MiniMax

кодовый агент

Token Plan от $10

через ACP

Alibaba QwenCode

кодовый агент

Lite $10 / Pro $50

по API или через ACP

Z.AI GLM

кодовый агент

Lite $18 / Pro $72 / Max $160

по API или через ACP

Xiaomi MiMo

кодовый агент / API

Lite $6 (−12% 1-я) / API $0.14

по API или через ACP

OpenRouter

агрегатор

Free / цена у каждой модели своя

по API

Что брать под домашний *Claw-харнес?

  • Дешёвый always-on агент в мессенджере на западной модели - OpenRouter или Codex если есть подписка Plus, если нет, тогда DeepSeek, MiMo или Qwen по API (стоит копейки).

  • Нужен именно Claude - некоторым людям по религиозным причинам больше нравятся модельки от Anthropic, для них подойдёт API-ключ плюс проставляем жёсткие лимиты в конфиге, а вот ClaudeCode для Claw-харнес не самый лучший вариант, могут забанить акк.

  • Китайский стек без “туннелей” - Qwen Coding Pro или Z.AI Coding Plan, либо MiMo по API, а если лень выбирать, тогда OpenCode Go оптом.

  • Российский стек без “туннелей” - NeuralDeep как OpenAI-совместимый провайдер прямо в харнес, либо Kodacode, если нужен агент в IDE/CLI или же встроить в свой харнес через ACP.

  • Локально и без сюрпризов - llama.cpp, vLLM, Ollama и любая модель от 100b и выше (потому что ниже 100b жизни нет) типа Kimi, GPT-OSS, Qwen, DeepSeek и т.д. на своём железе.

Вместо вывода

Разница между OpenAI и Anthropic не такая уж и большая. OpenAI зашивает Codex в экосистему подписок и этим тянет людей внутрь. Anthropic затягивает людей на свою экосистему вынуждая любителей харнес переходить на API на фоне хайпа вокруг агентов вообще и клодкода в частности. Китайцы в массе своей API-first, но шустро заводят Coding Plan’ы аля Claude Code. Cursor делают свою мастхевную IDE. Прочие харнесы - Qwen, Z.AI, MiniMax, Kimi, Xiaomi, Neuraldeep и Kodacode идут своим путём, предоставляя решения под наш рынок.

Послесловие

Этот пост написан в рамках события #МесяцАгентности, которое я запустил 1 июня сего года.

Кстати, решения от Сбера и Яндекса я в подборку специально не брал - их применимость в кодовых агентах я проверял ранее, и почти все модели показали слабые результаты, подробнее тут и тут.

Спасибо за прочтение, буду рад вашим комментариям, а так же подписывайтесь на мой телеграм-канал @evilfreelancer.

Всем хороших выходных!

Комментарии (38)


  1. Kenya-West
    12.06.2026 18:50

    Спасибо за аналитику, плюсанул от души! Недавно (сегодня) в связи с огромным зоопарком моделей, провайдеров, сложностью сетевых переплетений в стиле сексуальных девиаций "кто с кем, cuck и через что" и "выстрелом" (а по fuck'ту прогреву лаоваев) Xiaomi MiMo по якобы "дешевизне" я позаботился вопросом анализа этого всего бобра. И тут ваша статья, шикарно.

    Один вопрос - кодинг агенты ведь не предназначены напрямую для OpenClaw? Короче, раньше был бесплатный тест-драйв от GenSee.ai - они тебе и сервер, и агента, и платную нейросети полностью бесплатно давали. Сейчас таких предложений забесплатно даже по триалу нет, а цены поднимаются выше $30/месяц. Почему? Ведь есть же бесплатные модели... Не очень понимаю. Мне бот нужен чисто для 10-20 нормисов в ватсаппе со средним IQ не выше 80, так что туда любая модель и сервер подойдут. Согласен платить $1-3 в месяц, сервер есть. А предложений на рынке почему-то нет...


    1. joomlageek
      12.06.2026 18:50

      Может проще кинуть на API Qwen/Deepseek/Mimo/Openrouter несколько долларов если запросов немного? Зачем смотрите сразу подписку, платите за запрос. Сравните цены, качество, сделайте выводы.

      Бесплатные предложения есть, например, ollama cloud, Nvidia дают бесплатно API с лимитами.


    1. akakoychenko
      12.06.2026 18:50

      Мне бот нужен чисто для 10-20 нормисов в ватсаппе со средним IQ не выше 80, так что туда любая модель и сервер подойдут

      Откуда такая уверенность, что тупой энд-юзер -> низкие требования к модели?)

      Если пользователь не сильно интеллектуален, значит, и запросы формулирует не факт, что качественно, что может требовать даже большей нагрузки на модель, чем общение с, например, выпускников физмат вуза, способным строго сформулировать задачу.

      Кроме того, маленькие модели ох как любят галлюцинировать. Если там что-то типа техсаппорта, то можно внезапно наобещать этим нормисам слишком многого


    1. Dhwtj
      12.06.2026 18:50

      кто с кем, cuck и через что

      Если материшься делай это грамотно

      Слово такое есть но смысл не подходит


  1. ivolake
    12.06.2026 18:50

    А Trae и Qoder почему не сравнили?


    1. efreelancer Автор
      12.06.2026 18:50

      О данных платформах ранее не слышал, но за наводку спасибо, попробую.


  1. Dreams_and_magic
    12.06.2026 18:50

    регистрируетесь на openrouter через почту на иностранном почтовике (не google!), пополняете криптой - сами или через барыг на ggsel.
    на этом всё, юзайте аккакунт до исчерпания денег:) потом цикл повторить.


    1. Kenya-West
      12.06.2026 18:50

      Тот самый OpenRouter, который не пинал только ленивый? Они лагают так, будто там на каждый запрос живой индиец отвечает.


      1. Dreams_and_magic
        12.06.2026 18:50

        Скорость зависит от модели. Бесплатные очень медленные, платные быстрые.


    1. efreelancer Автор
      12.06.2026 18:50

      В целом к OpenRouter к меня нет претензий, за некоторыми нюансами, хороший поставщик, а для фалбэка так вообще идеальный, однако, выскажу непопулярное на Хабр мнение, но лично я к крипте после 22го года как-то с лёгким недоверием отношусь, поэтому и не упомянул в посте данный вариант. Но не спорю, что он тоже вполне рабочий.


    1. mahmud90
      12.06.2026 18:50

      Зарегистрирован на openrouter через почту gmail, оплачиваю рублями через plati.market (в итоге оплата идет криптой, имею в виду что на plati.market можно спокойно оплатить рублями).


    1. 0whitewolf0
      12.06.2026 18:50

      Я не разобрался до конца как это работает. Но что-то через openrourer деньги сжигаются очень быстро. Вот например дипсик про напрямую я закинул 5 баксов, Я неделю гонял где суммарно больше 60 млн токенов, да там большая часть дешевых кешированных, и осталось еще 2.5 бакса. Через опенроутер я попробовал одну задачу только на анализ проекта поставить и у меня он сжег сразу 1 бакс при этом мне ещё пришлось остановить. Да и с другими моделями тоже быстро жгутся. В общем пока мне опенроутер показался очень дорогим. А вот дипсик очень радует и качеством и скоростью и ценой.


  1. MEGA_Nexus
    12.06.2026 18:50

    У вайбкода два пути: Code-подписка и API

    Скорее два стула, а не два пути )))


    1. nav68
      12.06.2026 18:50

      Один жидкий, а второй без бумажки.


    1. efreelancer Автор
      12.06.2026 18:50

      Давно мечтал сделать такой звонкий и хлёсткий заголовок, а так-то согласен)

      Ещё есть третий путь и он у каждого свой в виде on-premise моделей на домашнем железе, но тут потребуется это самое железо прикупить, а моделям более менее приличным железа надо много.


  1. fire64
    12.06.2026 18:50

    у Z.AI GLM бесплатный агентный режим через веб интерфейс, вполне себе неплохо работает и вроде без жёстких лимитов.


    1. Dreams_and_magic
      12.06.2026 18:50

      И у Opencode есть:)


  1. imann
    12.06.2026 18:50

    ну как так, все импортное. А если надо что-то конфиденциальное обработать на сервере в РФ? Яндекс становится все дороже с каждым днём((


    1. efreelancer Автор
      12.06.2026 18:50

      Не всё импортное, я в список специально ещё Koda и Neuraldeep добавил, обе компании в России находятся, Koda делаете агента Kodacode, а у Neuraldeep on-premise модельки на своём железе.


      1. imann
        12.06.2026 18:50

        За Neuraldeep  спасибо, буду читать


    1. ale007xd
      12.06.2026 18:50

      Для конфиденциального только своё поднимать, и я бы в сторону Яндекс тем более не смотрел


  1. Dreams_and_magic
    12.06.2026 18:50

    И ещё очень хорошо и быстро работает "Gemini 3.1 flash" и "Gemini 3.1 flash Lite", у "Gemini 3.1 flash Lite" бесплатно 500 запросов в день, для нетяжёлого использования хватает.

    Использую бесплатный лимит "Gemini 3.1 flash Lite" в OpenCode.
    Как использовать бесплатный лимит Gemini в OpenCode, скоро выйдет статейка (на модерации).


    1. efreelancer Автор
      12.06.2026 18:50

      Эх если у гугла не было запрета на доступ к моделям из России, то я бы их тоже попробовал, как-то слишком быстро определяют даже через туннели, не успевал распробовать, поэтому в ресёрч и не попали.


      1. MrInfinity666
        12.06.2026 18:50

        У меня три подписки про на год бесплатные + ультра на месяц за полцены. Никакими ограничениями за последний год и не пахло


    1. Sol0Zon3
      12.06.2026 18:50

      Тегните меня пожалуйста, буду ждать вашу статью)


  1. StudyQA
    12.06.2026 18:50

    Практика из продакшена: 100+ сессий Claude Code в день на нескольких проектах.

    API (через Claude Code CLI) выигрывает, когда нужна автоматизация: cron-задачи, пакетная обработка, CI/CD пайплайны. У меня 107 Telegram-топиков, каждый маршрутизирует задачи отдельной сессии Claude с собственным контекстом. Это невозможно через Code-подписку.

    Подписка выигрывает для интерактивной разработки: когда сидишь перед экраном и итеративно отлаживаешь. Артефакты, предпросмотр, файловый менеджер.

    Ключевое наблюдение: стоимость API непредсказуема. Один неудачный промпт с большим контекстом может стоить больше, чем дневной лимит подписки. Для команд без опыта оптимизации промптов подписка безопаснее.


    1. brrr
      12.06.2026 18:50

      А можете поделиться, что разрабатываете и как пайплайн устроен?


    1. rPman
      12.06.2026 18:50

      У меня 107 Telegram-топиков

      что это такое, в смысле как организовали работу?


  1. bjl
    12.06.2026 18:50

    Deepseek reasonix вышел, не смотрели?


    1. efreelancer Автор
      12.06.2026 18:50

      Не пробовал, на вид какая-то сторонная разработка по типу OpenCode.


  1. Ra2007
    12.06.2026 18:50

    Работаю на Max подписке Claude Code уже два месяца, до этого сидел на API с pay-per-token. Разница в экономике ощутимая, но не там где ожидал. Токены на API при активной разработке выходили в $150-200 в месяц, Max стоит $100, казалось бы очевидно. Но главная выгода не в деньгах, а в поведении: когда платишь за токен, начинаешь неосознанно сжимать контекст, резать историю, избегать больших файлов. На фиксированной подписке агент наконец-то получает полный контекст без ограничений и качество заметно другое. Единственное о чём редко пишут: у Code-подписок свои rate limits которые не совпадают с API лимитами, и в пиковые часы можно упереться в throttling даже на Max.


  1. MaXaoH_Forever
    12.06.2026 18:50

    А мы просто кибер-рэкет, хочешь к нам - давай плати!


  1. MrFr3di
    12.06.2026 18:50

    Дешёвые цены на токены дипсика у кодикроутера, сравнивал многие сервисы и скажу так: везде охуели


  1. AiR_WiZArD
    12.06.2026 18:50

    Вот только таблица вообще неинформативна. Цены у всех +- одинаковые, а вот кол-во токенов, выдающихся за подписку совершненно разное и потратить их можно тоже по разному. У клода 5 часовое окно довольно маленькое и рассчитано на то, что бы за один днень не получилось все лимиты сжечь. У alibaba (квен) ровно противоположное - токенов дается не так что бы много, да и к тому же ты можешь потратить всю месячную квоту хоть за один день. z.ai как и openai находятся где-то посредине, можно потратить за 2 дня недельный запас, если очень надо. После тестов пришел к тому, что z.ai с 80$ подпиской меня более чем устраивает, в отличии от закрытых модель хотя бы есть уверенность, что под капотом в очередной раз не перекрутят модель, как уже делали openai и антропики.


    1. efreelancer Автор
      12.06.2026 18:50

      Спасибо за критику, замечание справедливое. В этом посте я специально начал с верхнего уровня - цен, формата подписок и общей логики тарифов. До честного сравнения по токенам, окнам, месячным квотам и тому, как быстро всё это можно сжечь, там ещё копать и копать.

      Буду только рад, если кто-то после этого сделает более дотошный разбор. Потому что по деньгам тарифы действительно похожи, а по фактической ёмкости и ограничениям могут отличаться очень сильно.


  1. ale007xd
    12.06.2026 18:50

    если модель — это всего лишь провайдер событий, как построить детерминированную систему, которая переживёт смену Claude → GPT → Qwen → MiMo без переписывания логики? И выбирать в итоге ту, которая актуальна с точки зрения цены на прямо сейчас?


    1. rPman
      12.06.2026 18:50

      Не думаю что детерменированность возможна при условии использования llm, их поведение хаотично и сильно зависит не только от входных данных но и от их подачи.

      Эффективная работа агентов на основе llm сильно зависит от системных промптов и особенностях алгоритмов организации цикла и сжатия длинного контекста. Топовые агенты (claude code и codex от openai) еще под капотом имеют роутер, меняющий модель на слабую в зависимости от задачи (у других компаний можно выбирать вручную), что так же не способствует детерменированности.

      Совершенно нормально сделать 10 запусков агента с одними и теми же вводными и получить разные результаты.


  1. RichHE
    12.06.2026 18:50

    Обзор огонь, как раз вовремя! Экономика кодовых агентов в режиме 24/7 — это сейчас реально самая больная тема. Когда агент начинает по кругу перечитывать контекст репозитория, прогонять тесты и вайбкодить сам себя, стандартные лимиты подписок улетают за пару дней. Провайдеры через специализированные эндпоинты (тот же Claude Code через ACP) пытаются это балансировать своими внутренними алгоритмами кэширования, но контекст всё равно пухнет экспоненциально.

    Я сейчас ради спортивного интереса ковыряю с математической стороны одно решение как раз для таких долгоживущих харнесов — динамический семантический компрессор промптов (Prompt Compression) на базе легковесной локальной модели.

    Суть в том, чтобы перед тем, как агент выплеснет всю историю чата, системных промптов и кусков кода в API, прогонять этот массив через промежуточный слой, который безжалостно вырезает низкоэнтропийные токены и стоп-слова, оставляя только жесткую семантическую суть для attention-механизма старшей модели. По тестам на текстах выходит экономия до 30-40% объема без потери качества логики.

    Как думаете, если внедрить такую прослойку прямо в кастомный харнес между агентом и условным OpenRouter/API, чтобы зажимать исходящий контекст «на лету», это сильно поломает кодогенерацию в сложных многошаговых задачах, или для экономии квот имеет право на жизнь?