В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.

Не приложение. Не «навык для колонки». А маленький компаньон, которого можно повесить на шею, прицепить к рюкзаку или кинуть в карман. Который слышит, понимает, запоминает – и не исчезает вместе с закрытием вкладки.

Я давно в технологиях, запускал проекты в робототехнике и AI, но к «железу для себя» почти не прикасался. Всё сдвинулось, когда я увидел попытки вытащить ИИ из телефона и вернуть ему присутствие. Разговор с ИИ перестаёт быть «сеансом связи» и становится постоянным диалогом.

Дисклеймер: фото и видео в этом посте – из раннего проекта, в котором я участвовал. Мы тестировали гипотезы, но тот проект не полетел. Сейчас собираю новую версию с другим дизайном и подходом.

Что я строю прямо сейчас ?

Рабочее имя: Berry (не финал). Носимое устройство с микрофонами, маленьким экраном и постоянным контекстом.

Сейчас это «цифровой тамагочи на стероидах»: плата, провода, 3D-корпус. Но он уже оживает – реагирует на голос, передаёт аудио, возвращает ответы. Иногда глючит, иногда тупит – это нормально для v0. Главное, это мойкомпаньон, а не чей-то сервер за океаном.

Зачем вообще это всё ?

  • Присутствие ? – фиксируешь мысль за секунду, без «открой приложение».

  • Контекст ? – он учится тебе, а не энциклопедии.

  • Деликатность ? – явная индикация, никакой скрытой записи.

  • Скорость ⚡ – меньше трения между намерением и действием.

Как это будет работать (v0, черновик) ⚙️

  • 1–2 MEMS-микрофона, AEC/NS/AGC, детект активации.

  • Связка с телефоном по BLE/Wi-Fi; тяжёлые задачи – через мобильный мост (позже больше на устройстве).

  • Экран 1–2″ для статуса и коротких подсказок.

  • Режимы: «заметка», «подскажи», «наблюдатель» – всегда с видимой индикацией.

  • Сначала ответы из облака, постепенно – больше on-device и приватности.

Чего не будет ?

  • Тайной записи без индикации.

  • Агрессивной телеметрии и «продажи внимания».

  • Слайдовой магии без живых демо – показываю только то, что работает.

Дорожная карта ?️

  • v0: довести до «ношу целый день» (стабильность, UX-скелет).

  • Малая бета-партия → отладка → переход на специализированную плату.

  • Приватность/оффлайн, батарея и форм-фактор – итерациями.

Кому это зайдёт ?

  • Предпринимателям и креаторам, у которых идеи «сыпятся не вовремя».

  • Специалистам с плотным днём – важнее не «знать всё», а не забывать своё.

  • Тем, кто хочет «второго себя» – без цирка, просто чтобы жить и работать легче.


Ищу людей ?‍♂️

  • Embedded-инженера (edge/audio/hw/LLM): микрофоны → фильтрация → кодек → транспорт → ASR → ответ. Опыт с ESP/STM/Zephyr/RTOS, AEC/NS, BLE/Wi-Fi, мобильным мостом – будет супер.

  • Потенциального CTO, который возьмёт стек end-to-end: архитектура, прошивка, бэкенд, app-мост, безопасность. Я сфокусируюсь на маркетинге, продажах и инвестициях.

  • Бета-юзеров, готовых тестировать и ломать.

  • Наблюдателей, которым интересно смотреть честный дев-лог со взлётами и фейлами.

Дальше будет ?

Это серия заметок – от эскизов и спагетти-проводов до работающего устройства: технические разборы, провалы и победы, честные выводы. Если интересно посмотреть, как ИИ перестаёт быть «ещё одним приложением» и становится частью повседневности – подписывайтесь.

Контакты ?

Комментарии (31)


  1. AppCrafter
    18.08.2025 15:59

    Идея интересная. Но вроде уже Сэм Альтман с Джони Айвом такое делают.


    1. mike_melanin Автор
      18.08.2025 15:59

      Так это же замечательно!


  1. select26
    18.08.2025 15:59

    Главное, это мойкомпаньон, а не чей-то сервер за океаном.

    А для ваших покупателей он опять превратится в "чей-то сервер ". Магия )


    1. spc
      18.08.2025 15:59

      А вдруг можно будет у себя дома запускать? Как ownCloud. А, @mike_melanin?


      1. mike_melanin Автор
        18.08.2025 15:59

        в перспективе это все будет на edge, хотя бы на телефоне.


  1. RalphMirebs
    18.08.2025 15:59

    Лет 10 назад был в рунете такой проект Cube (или Кубик, уже не помню точно)
    Личный ИИ-помошник, массив микрофонов, никакого облака.. Но шли годы, от автономной работы решили отказаться и превратились в инетозависимого. При этом, тогда ИИ был менее сообразительный. Чем закончилось не помню, я перестал следить после отказа от автономности.


    1. spc
      18.08.2025 15:59

      Интересные ребята (и блог на Хабре одно время был), кстати. Я бы даже сказал, очень талантливые, но как-то у них не очень ровно вышло. С Кубика попытались переключиться на носимого ассистента, насколько я помню. С ним не очень вышло, переключились на навыки для виртуальных ассистентов в Штатах. На этом месте я тоже перестал за ними следить, а сейчас заинтересовался и загуглил, и там прямо детектив дальше.

      РБК нам сообщает, что их наработки (например, микрофонный массив Кубика) взяли в Яндексе для своих станций. Там же одно время трудился над Алисой и один из основателей Кубика - Юрий Буров.

      Мне с ними повезло пообщаться в Москве, еще в самом начале кубика. Потому что они случайно подумали, что я крутой инженер, но ошиблись.


      1. mike_melanin Автор
        18.08.2025 15:59

        я в сша с ним познакомился в коворке амазона - клевый товарищ!


  1. nikolz
    18.08.2025 15:59

    Можно сделать автономный без смартфона: модуль на чипе ESP32+карта памяти.

    В брелке BLE модуль на чипе TLSR.


    1. WFF
      18.08.2025 15:59

      Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM

      И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388


      1. nikolz
        18.08.2025 15:59

        И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388

        Это не то. В этом решении часы долго не проработают , объем памяти не позволит разместить LLM.

        ------------------------

        Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM

        Это решение, да и подобные на али требуют подключения к интернет и подписку.

        ------------------------

        Я написал о возможном решении как в статье.

        Брелок будет работать долго так как BLE.

        А LLM размещается локально в отдельном модуле , который помещается на пояс и имеет более мощный аккумулятор.

        Но прикол в том, что LLM DeepSeek не умеет ходить в интернет и использует информацию на момент его создания т е до 2024 года. Это свойство всех LLM.


        1. mike_melanin Автор
          18.08.2025 15:59

          вы все правильно рассуждаете - за основу для MVP взять поделие китайцев или же форкнуть omi. К сожалению, я больше про продажи и UX - сейчас буду искать технического партнера (текущий отвалился).


      1. vingor
        18.08.2025 15:59

        Так у XiaoZhi все готовое и контроллер под esp32. И Сервера три версии пайтон, жава и еще ктото. Сейчас сам с китайцами поднял тему занимаюсь, адаптацией и русификацией их поделия. Очень большой выбор речь в текст текст в речь и llm


        1. mike_melanin Автор
          18.08.2025 15:59

          давай спишемся в телеге - @mike_melanin - обменяться мыслями и расскажешь что у китайцев готовое раз уже все расковырял.


  1. kenomimi
    18.08.2025 15:59

    Тоже совсем недавно хотел сделать умный кулон/брелок на базе тех круглых экранов с esp32s3... Напечатал корпус, добавил батарею, и в целом даже запустил демо.

    Но платформа сама по себе мне не очень нравится - конфиг по сложности на голову превосходит линуксовый, сборка представляет собой магию, почти везде используется чистый С, энергоэффективность никакущая для микроконтроллера...

    Фото

    Как по мне, проще взять маленький линуксовый чип - софта больше, дров больше, качество кода выше, потребление сравнимое. SoM полно на рынке, разводятся на двуслойной плате легко.


    1. mike_melanin Автор
      18.08.2025 15:59

      как с тобой связаться и пообщаться?


  1. Indemsys
    18.08.2025 15:59

    Тут идеально вписывается RA8P1. Для локального ML это наверно самый сейчас эффективный чип по потреблению и скорости.
    И такой дивайс должен иметь уже камеру. Детекция лиц там есть в демке.
    Микрофонную решетку тоже поддерживает.
    Для низкопотребляющего WiFi - SiWx917M
    Для глобального подключения как опция - nRF9151


    1. mike_melanin Автор
      18.08.2025 15:59

      инференс чистый на девайсе - имхо пока утопия и лишнее усложнение. Про камеры я вообще молчу...


      1. artmel
        18.08.2025 15:59

        На таком девайсе да.

        На более мощном нет. смарты вполне справляются.

        Но тогда получается ваш девайс такойже приватный и безопасный как яндекс алиса, и обрабатывает и хранит данные где угодно только не в контролирруемом покупателем месте. пока единственное что может потянуть из "дешевого" железа это малинка последняя и пачка ускрителей helio к ней. но опять же это дешево только условно, а жрет хорошо электричество


        1. mike_melanin Автор
          18.08.2025 15:59

          не все сразу - в POC принципиально отличий архитектурно от алисы нет, но нужно проверить концепт, что не только мне нужен карманный ИИ дружок.


          1. artmel
            18.08.2025 15:59

            Ну пока нет успешных кейсов такого устройства.

            да и в текущем формате, есть ли смысл? все это легко делается как программа для смартфона. так как в текущем виде это просто выносной микрофон с неонкой. а проверить на программе гораздо легче чем на железке


        1. azTotMD
          18.08.2025 15:59

          Как-то эксперемнтировали с google coral, запихнули туда довольно большой сегментатор изображений. Работает медленнее, конечно, чем на V100, но не намного, раза в 1.5 - 2, а штука эта размером с мобилу. Вот сила TPU-шек.

          LLM, поди всё равно в него не запихнуть, надо подрезать размер. С другой стороны, LLM для чего такое кол-во параметров? Чтобы у неё в весах осела информация на всех языках и обо всём, до чего дотянулись скраперы. Вряд ли юзеру такой штуки нужно больше, чем пара языков.

          А вот классическое обучение там уже не сделать, бэкпроп не работает на целых числах, а TPU ускоряет именно перемножение матриц целых чисел. Т.е. тут если только изобретать свои алгоритмы обучения.

          Согласен с вашим комментарием выше, что в текущей постановке в этом нет никакого смысла. Без хотя бы инференса на девайсе, нет никакого заявленного автором "Физический. Мой." А сделать инференс языковой модели на портативной железке это тот ещё челлендж.


  1. nikolz
    18.08.2025 15:59

    У этих чипов цена кусачая.

    образец чипа  RA8P1 от 3000 руб. Отладочная плата от 30 000 руб.

    модуль SiWx917M на Али от 6000 руб

    модуль nrf9151 на Али от 15000 руб

    модуль ESP32C3 на Али от 130 руб


    1. Indemsys
      18.08.2025 15:59

      Ну эт все равно что предложить делать телегу вместо машины, потому что колеса дешевле.


      1. nikolz
        18.08.2025 15:59

        Вы ошибаетесь. Указанные Вами чипы избыточны по вычислительной мощности. Да и брелоки и часы из них будут тяжелыми ( ток потребления  RA8P1 1 А.) Вы купите смарт часы за 1000$?


        1. Indemsys
          18.08.2025 15:59

          Не смешите мои наушники.
          В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.
          Если сложить их пиковые токи, то ампера 2-3 наберется.
          А работают неделями.

          А так да,  RA8P1 не хватает audio DSP и это максимум что можно найти на публичном рынке. Дальше только дороже.
          ESP32 тут и рядом не лежат.


          1. nikolz
            18.08.2025 15:59

            В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.Если сложить их пиковые токи, то ампера 2-3 наберется.А работают неделями.

            Не понял, что смешного Вашим наушникам.

            Можете доказать, что работают неделями?


            1. Indemsys
              18.08.2025 15:59

              Мы еще с избыточной мощностью не разобрались.
              Наушники смеются с понятия "избыточной вычислительной мощности"
              У них самих там на полтора гигагерца набегает и при этом они так себе давят шум, и визжат от сильных звуков.


  1. azTotMD
    18.08.2025 15:59

    Из статьи не очень понятно, что вы делаете.

    В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.

    подумал, что хотите свою железку с LLM. Типа: микрофон -> сетка для распознания речи -> LLM -> ответ на мониторе.

    он учится тебе, а не энциклопедии.

    Как будто говорится не только об инференсе, но и обучении.

    Но потом фразы:

    Связка с телефоном

    Сначала ответы из облака

    разрушают магию


    1. mike_melanin Автор
      18.08.2025 15:59

      в перспективе собирается твой граф знаний, который будет учитываться в промптинге. Не все же сразу.


      1. artmel
        18.08.2025 15:59

        Графовая база очень требовательна к памяти, которая очень ограниченна у таких устройств.