Qwen3.7 Plus от Alibaba и GLM 5.2 от Z.AI теперь работают без VPN. Обе заточены под кодинг и агентные задачи, обе держат миллион токенов контекста, и обе могут вам пригодиться. Как получить к ним доступ без подписок и сервисов обхода, разбираемся в этой статье.

Qwen3.7 Plus: мультимодальный агент за копейки

Qwen3.7 Plus — это мультимодальная версия агентного бэкбона Qwen3.7 примерно в шесть раз дешевле, чем флагманский Qwen3.7 Max.

Главная фишка модели — multimodal interactive hybrid agent: она умеет воспринимать реальные сцены, читать экраны и взаимодействовать с GUI, генерировать код по визуальным референсам и автономно навигировать в мобильных приложениях. Проще говоря, это агент, который видит экран и работает с ним напрямую.

На кодинг-бенчмарках Qwen3.7 Plus показывает результаты, близкие к Max-версии: Terminal Bench 2.0, SWE-bench и SciCode — уверенные позиции как в реальных задачах разработки, так и в научном программировании. На агентных задачах — сильное планирование и tool use.

На SWE-Bench Pro — около 57,6% против 60,6% у Max. Разрыв в три пункта при разнице в цене в шесть раз. Для большинства задач это выгодная сделка.

GLM 5.2: вышел через 48 часов после того, как США заблокировали Fable 5 для иностранцев

13 июня 2026 года правительство США ограничило доступ к Claude Fable 5 и Mythos 5 для иностранных пользователей. Через несколько часов Z.AI выпустила GLM 5.2 — 744-миллиардную модель с открытыми весами под MIT-лицензией. Компания прямо заявила, что релиз строится вокруг идеи «frontier intelligence belongs to everyone» — намеренный ответный ход в гонке США и Китая за ИИ-доминирование.

По техническим характеристикам: 753 миллиарда параметров, 1 миллион токенов контекста, MIT-лицензия — скачивайте, модифицируйте, деплойте коммерчески без ограничений. Архитектурная оптимизация называется IndexShare: вместо того чтобы пересчитывать механизмы внимания по всему длинному контексту, индексер переиспользуется на каждые четыре слоя sparse attention — это и даёт возможность работать с миллионом токенов без коллапса по памяти.

По бенчмаркам: GLM 5.2 опережает GPT-5.5 примерно на 1% на FrontierSWE и занимает первое место среди открытых моделей на long-horizon coding бенчмарках. Сильные позиции на PostTrainBench и SWE-Marathon. При этом стоимость в шесть раз ниже, чем у GPT-5.5.

Два режима рассуждения: High — быстрый, для обычных задач, Max — медленнее, но глубже, для сложного многофайлового кодинга. Из коробки совместима с Claude Code, Cline, Cursor, Goose, OpenClaw и ещё несколькими IDE.

Честная оговорка: независимых бенчмарков на старте не публиковалось — только вендорские заявления и ранние тесты. Подождите пару недель, прежде чем ставить на неё mission-critical пайплайн.

Почему это важно для российских пользователей

Именно GLM 5.2 закрывает вопрос, который возник после ограничений Fable 5: нужна мощная открытая модель для кодинга с длинным контекстом, которую нельзя отозвать решением американского регулятора. MIT-лицензия и открытые веса — это и есть страховка от того, что произошло с Fable 5.

Обе модели — Qwen3.7 Plus и GLM 5.2 — уже доступны на SpeShu.AI. Без VPN и зарубежных подписок, с оплатой в рублях по СБП. Ещё выгоднее с промокодом HABRTSNIS15.

Комментарии (8)


  1. SensDj
    17.06.2026 17:56

    чем ваш платный сервис лучше чем бесплатный chat.qwen.ai ?


    1. Axelaredz
      17.06.2026 17:56

      На сайте Qwen теперь лимиты же более жёсткие, не выйдет целый день халявой заниматься)


  1. evsom
    17.06.2026 17:56

    С миру по нитке - голому рубашка :))


    1. Slav2
      17.06.2026 17:56

      Решил проверить speshu.ai сервис с их бесплатной моделью SpeShu Pro

      Промпт: ты начинаешь движение по эскалатору длиной 200 метров наверх. Эскалатор при этом движется в обратную сторону. За счет этого движения ты пройдешь 800 метров относительно полотна эскалатора пока доберешься до конца эскалатора. Сколько метров ты пройдешь относительно полотна эскалатора если будешь двигаться вдвое быстрее?

      Ответ порадовал, даже не поленился загрузить скрин ))


  1. SashaKuzikov
    17.06.2026 17:56

    Так понимаю, что речь не про модели - очень скудная информация, а про сервис.

    Если цены в чате в токенах, то это на порядок дороже аналогичных сервисов.

    Цены на API спрятаны в самом API и без токена не получить и нужно регистрироваться. На сайте цен не нашел. Нет статистики Uptime, скорости и времени доступа. Кот в мешке.


  1. simon100500
    17.06.2026 17:56

    На главной: «предоставляет доступ к ChatGPT, Cloud».

    Что такое Cloud?


  1. dmiche
    17.06.2026 17:56

    Вот после таких вдохновенных постов пишут знакомые и спрашивают, правда ли, что китайцы выпустили замену Фейбла.


  1. Sinclear
    17.06.2026 17:56

    Угу, открою страшную тайну заходим на z.ai и бесплатно пользуемся glm