Всё началось с того, что пару месяцев назад я сломал левую руку. Печатать одной правой оказалось той ещё пыткой, поэтому я начал искать альтернативы. Ради интереса попробовал встроенную диктовку на Маке, которой отродясь не пользовался. И внезапно обнаружил, что современный голосовой ввод в macOS — это пушка. Он отлично справляется с моим быстрым темпом речи и сложными словами. Я начал диктовать вообще всё: от сообщений в Telegram до рабочих промптов.

А потом я попытался сделать то же самое на Android.

Будем честны: голосовой ввод на Android в 2026 году — это по-прежнему боль. Встроенный Gboard на русском спотыкается на сложных словах, глотает окончания, теряется в длинных фразах и игнорирует пунктуацию. Яндекс Клавиатура ведет себя примерно так же.

Казалось бы, скачай другую клавиатуру и не мучайся. Но тут возникает конфликт со свайпом. Найти решение, где одновременно круто работает и голос, и русский свайп, просто нереально. У Gboard сейчас лучший свайп, но отвратительная диктовка. У альтернатив всё ровно наоборот.

Я перепробовал опенсорсные варианты из Play Market (вроде Futo Keyboard и Futo Voice Input). Для русского языка они абсолютно неюзабельны: либо модель откровенно слабая, либо интерфейс тихий ужас.

Единственное реально классное приложение, которое я нашел — Wispr Flow (они выкатили Android-версию в конце февраля). Распознает шикарно. Но есть два нюанса: подписка за 12 баксов в месяц и отправка вашего голоса на их серверы. Для базовой системной функции это как-то чересчур. На контрасте с Маком, где диктовка из коробки работает на твердую четверку, на Android с русским языком — просто глухо.

Месяц назад я купил Pixel 10. Думал, ну вот оно: Google активно пиарит Gemini Nano, локальная LLM прямо на процессоре. И тут меня ждал сюрприз. Gboard всю эту магию для русского языка тупо не использует. Распознавание работает хуже, чем облачные модели пятилетней давности. Когда они доучат Gemini Nano великому и могучему — неизвестно. Может через полгода, может никогда.

В этот момент я окончательно сгорел и решил изобретать свой велосипед.

Как я это собрал

Вместо того чтобы писать очередную клавиатуру с нуля, я подсмотрел изящный хак у Wispr Flow. Они сделали всплывающую кнопку голосового набора через Accessibility Service (службу специальных возможностей). Она появляется при тапе по любому текстовому полю. То есть вы оставляете свой любимый Gboard ради свайпа, но диктуете голосом через отдельный сервис.

Фундаментом моего приложения стала модель GigaAM v3 от Сбера. Это открытая (MIT) нейросеть, натасканная специально на русский язык. По качеству она не уступает тяжелому Whisper Large, но работает в разы быстрее.

Под капотом получился вот такой комбайн:

  • GigaAM v3 — квантизованная версия в формате ONNX (~327 МБ).

  • sherpa-onnx — рантайм. Под капотом — ONNX Runtime Mobile с нативными оптимизациями под ARM. Использует NNAPI на Android 13+ и сам падает на CPU, если что-то идет не так.

  • Silero VAD — крошечный детектор речи (всего 629 КБ). Он отслеживает паузы, чтобы автоматически разбивать длинную диктовку на абзацы.

  • Accessibility Service — вставляет распознанный текст напрямую в активное поле любого приложения, минуя буфер обмена и не ломая историю отмены (Undo).

Весь интерфейс — это одна плавающая кнопка поверх окон. Тапнул — говоришь, сделал паузу — абзац перенесся, тапнул еще раз — остановил. Никаких лишних настроек. Сам UI собран на Material Design 3 с поддержкой Dynamic Colors, так что бабл и системные экраны тянут палитру с обоев телефона.

Если интересен ландшафт десктопных решений (WisprFlow, Handy, OpenWhispr и так далее) — пару дней назад на Хабре вышел подробный обзор от другого автора. Про мобильную сторону там, правда, ни слова — этот пробел и решает Говорун.

Что в итоге

Я отлаживал всё на Pixel 6a, 8a и 10. На «пикселях» всё летает: задержка между концом фразы и появлением текста визуально вообще не ощущается, а качество распознавания (включая запятые и точки) обходит всё, что есть в системе.

С остальными вендорами — честно говорю: проверить не было возможности. Теоретически нужен только Android 13+ и ARM64, но качество NNAPI-драйверов сильно гуляет от производителя к производителю, а оболочки вроде MIUI или ColorOS любят прибивать фоновые сервисы под предлогом экономии батареи. Так что Samsung, Xiaomi, OnePlus и прочие требуют полевых тестов.

Приложение полностью офлайновое. Модель вшита в APK, интернет не нужен даже при первом запуске. Работает в авиарежиме, в глухом лесу, без симок и VPN. Никакой телеметрии, никакой аналитики, никаких рекламных SDK, никакой зависимости от Google Play Services. В сеть не уходит вообще ничего — это можно проверить, заглянув в исходники.

Зачем всё это было нужно

Во-первых, мне самому было больно этим пользоваться. Во-вторых, сломанная рука отлично прочищает мозги на тему цифровой доступности. Accessibility Service здесь используется по своему прямому назначению — помогает вводить текст тем, кому физически трудно печатать. Да, через пару лет корпорации наверняка допилят нормальный офлайн-голос. Но вакуум есть прямо сейчас, и его надо было чем-то заполнить.

Где потрогать

RuStore: rustore.ru/catalog/app/com.govorun.lite. Самый простой вариант: скачали, дали права на микрофон и Accessibility, пользуетесь.

GitHub: github.com/amidexe/govorun-lite (MIT лицензия). Если будете собирать APK самостоятельно на Android 13+, придется сделать пару лишних кликов в настройках (разрешить «Ограниченные настройки»). Инструкция есть в README.

P.S. Если у вас Samsung, Xiaomi, OnePlus или что-то ещё с агрессивной оболочкой — буду очень рад фидбеку в комментах. Без ваших полевых тестов я не пойму, что у кого взлетело, а что нет.

Комментарии (4)


  1. sunnybear
    25.04.2026 15:49

    Samsung пункты в меню называются по другому, вроде полет нормальный Добавьте, пожалуйста, распознавание списков (первое, второе, например)


  1. aborouhin
    25.04.2026 15:49

    Poco X6 5G с накатанной Lineage OS - всё взлетело и настроилось нормально. Собственно, этот комментарий я и пишу с помощью Говоруна.

    Отдельная просьба: озаботьтесь всё-таки и добавьте в Google Play :) Потому что тащить Рустор на телефон не хочется, а из apk обновлять головная боль.


    1. Barnaby
      25.04.2026 15:49

      1. aborouhin
        25.04.2026 15:49

        Да я про него знаю, спасибо :) Ещё есть https://codeberg.org/mi6e4ka/openstore. Никак не дойдут руки поставить, хотя уже несколько приложений есть, которым оно надо (либо в Google Play вообще нет, либо недоступны для не-РФ региона). Но когда есть возможность напрямую попросить автора сделать без костылей - почему бы не попросить :)