В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.
Не приложение. Не «навык для колонки». А маленький компаньон, которого можно повесить на шею, прицепить к рюкзаку или кинуть в карман. Который слышит, понимает, запоминает – и не исчезает вместе с закрытием вкладки.
Я давно в технологиях, запускал проекты в робототехнике и AI, но к «железу для себя» почти не прикасался. Всё сдвинулось, когда я увидел попытки вытащить ИИ из телефона и вернуть ему присутствие. Разговор с ИИ перестаёт быть «сеансом связи» и становится постоянным диалогом.

? Дисклеймер: фото и видео в этом посте – из раннего проекта, в котором я участвовал. Мы тестировали гипотезы, но тот проект не полетел. Сейчас собираю новую версию с другим дизайном и подходом.
Что я строю прямо сейчас ?
Рабочее имя: Berry (не финал). Носимое устройство с микрофонами, маленьким экраном и постоянным контекстом.
Сейчас это «цифровой тамагочи на стероидах»: плата, провода, 3D-корпус. Но он уже оживает – реагирует на голос, передаёт аудио, возвращает ответы. Иногда глючит, иногда тупит – это нормально для v0. Главное, это мойкомпаньон, а не чей-то сервер за океаном.

Зачем вообще это всё ?
Присутствие ? – фиксируешь мысль за секунду, без «открой приложение».
Контекст ? – он учится тебе, а не энциклопедии.
Деликатность ? – явная индикация, никакой скрытой записи.
Скорость ⚡ – меньше трения между намерением и действием.

Как это будет работать (v0, черновик) ⚙️
1–2 MEMS-микрофона, AEC/NS/AGC, детект активации.
Связка с телефоном по BLE/Wi-Fi; тяжёлые задачи – через мобильный мост (позже больше на устройстве).
Экран 1–2″ для статуса и коротких подсказок.
Режимы: «заметка», «подскажи», «наблюдатель» – всегда с видимой индикацией.
Сначала ответы из облака, постепенно – больше on-device и приватности.
Чего не будет ?
Тайной записи без индикации.
Агрессивной телеметрии и «продажи внимания».
Слайдовой магии без живых демо – показываю только то, что работает.
Дорожная карта ?️
v0: довести до «ношу целый день» (стабильность, UX-скелет).
Малая бета-партия → отладка → переход на специализированную плату.
Приватность/оффлайн, батарея и форм-фактор – итерациями.
Кому это зайдёт ?
Предпринимателям и креаторам, у которых идеи «сыпятся не вовремя».
Специалистам с плотным днём – важнее не «знать всё», а не забывать своё.
Тем, кто хочет «второго себя» – без цирка, просто чтобы жить и работать легче.
Ищу людей ?♂️
Embedded-инженера (edge/audio/hw/LLM): микрофоны → фильтрация → кодек → транспорт → ASR → ответ. Опыт с ESP/STM/Zephyr/RTOS, AEC/NS, BLE/Wi-Fi, мобильным мостом – будет супер.
Потенциального CTO, который возьмёт стек end-to-end: архитектура, прошивка, бэкенд, app-мост, безопасность. Я сфокусируюсь на маркетинге, продажах и инвестициях.
Бета-юзеров, готовых тестировать и ломать.
Наблюдателей, которым интересно смотреть честный дев-лог со взлётами и фейлами.
Дальше будет ?
Это серия заметок – от эскизов и спагетти-проводов до работающего устройства: технические разборы, провалы и победы, честные выводы. Если интересно посмотреть, как ИИ перестаёт быть «ещё одним приложением» и становится частью повседневности – подписывайтесь.
Контакты ?
Telegram: @mike_melanin_live
LinkedIn: linkedin.com/in/mikemelanin
Комментарии (31)
select26
18.08.2025 15:59Главное, это мойкомпаньон, а не чей-то сервер за океаном.
А для ваших покупателей он опять превратится в "чей-то сервер ". Магия )
RalphMirebs
18.08.2025 15:59Лет 10 назад был в рунете такой проект Cube (или Кубик, уже не помню точно)
Личный ИИ-помошник, массив микрофонов, никакого облака.. Но шли годы, от автономной работы решили отказаться и превратились в инетозависимого. При этом, тогда ИИ был менее сообразительный. Чем закончилось не помню, я перестал следить после отказа от автономности.spc
18.08.2025 15:59Интересные ребята (и блог на Хабре одно время был), кстати. Я бы даже сказал, очень талантливые, но как-то у них не очень ровно вышло. С Кубика попытались переключиться на носимого ассистента, насколько я помню. С ним не очень вышло, переключились на навыки для виртуальных ассистентов в Штатах. На этом месте я тоже перестал за ними следить, а сейчас заинтересовался и загуглил, и там прямо детектив дальше.
РБК нам сообщает, что их наработки (например, микрофонный массив Кубика) взяли в Яндексе для своих станций. Там же одно время трудился над Алисой и один из основателей Кубика - Юрий Буров.
Мне с ними повезло пообщаться в Москве, еще в самом начале кубика. Потому что они случайно подумали, что я крутой инженер, но ошиблись.
nikolz
18.08.2025 15:59Можно сделать автономный без смартфона: модуль на чипе ESP32+карта памяти.
В брелке BLE модуль на чипе TLSR.
WFF
18.08.2025 15:59Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM
И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388
nikolz
18.08.2025 15:59И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388
Это не то. В этом решении часы долго не проработают , объем памяти не позволит разместить LLM.
------------------------
Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM
Это решение, да и подобные на али требуют подключения к интернет и подписку.
------------------------
Я написал о возможном решении как в статье.
Брелок будет работать долго так как BLE.
А LLM размещается локально в отдельном модуле , который помещается на пояс и имеет более мощный аккумулятор.
Но прикол в том, что LLM DeepSeek не умеет ходить в интернет и использует информацию на момент его создания т е до 2024 года. Это свойство всех LLM.
mike_melanin Автор
18.08.2025 15:59вы все правильно рассуждаете - за основу для MVP взять поделие китайцев или же форкнуть omi. К сожалению, я больше про продажи и UX - сейчас буду искать технического партнера (текущий отвалился).
vingor
18.08.2025 15:59Так у XiaoZhi все готовое и контроллер под esp32. И Сервера три версии пайтон, жава и еще ктото. Сейчас сам с китайцами поднял тему занимаюсь, адаптацией и русификацией их поделия. Очень большой выбор речь в текст текст в речь и llm
mike_melanin Автор
18.08.2025 15:59давай спишемся в телеге - @mike_melanin - обменяться мыслями и расскажешь что у китайцев готовое раз уже все расковырял.
kenomimi
18.08.2025 15:59Тоже совсем недавно хотел сделать умный кулон/брелок на базе тех круглых экранов с esp32s3... Напечатал корпус, добавил батарею, и в целом даже запустил демо.
Но платформа сама по себе мне не очень нравится - конфиг по сложности на голову превосходит линуксовый, сборка представляет собой магию, почти везде используется чистый С, энергоэффективность никакущая для микроконтроллера...
Фото
Как по мне, проще взять маленький линуксовый чип - софта больше, дров больше, качество кода выше, потребление сравнимое. SoM полно на рынке, разводятся на двуслойной плате легко.
Indemsys
18.08.2025 15:59Тут идеально вписывается RA8P1. Для локального ML это наверно самый сейчас эффективный чип по потреблению и скорости.
И такой дивайс должен иметь уже камеру. Детекция лиц там есть в демке.
Микрофонную решетку тоже поддерживает.
Для низкопотребляющего WiFi - SiWx917M
Для глобального подключения как опция - nRF9151
mike_melanin Автор
18.08.2025 15:59инференс чистый на девайсе - имхо пока утопия и лишнее усложнение. Про камеры я вообще молчу...
artmel
18.08.2025 15:59На таком девайсе да.
На более мощном нет. смарты вполне справляются.
Но тогда получается ваш девайс такойже приватный и безопасный как яндекс алиса, и обрабатывает и хранит данные где угодно только не в контролирруемом покупателем месте. пока единственное что может потянуть из "дешевого" железа это малинка последняя и пачка ускрителей helio к ней. но опять же это дешево только условно, а жрет хорошо электричество
mike_melanin Автор
18.08.2025 15:59не все сразу - в POC принципиально отличий архитектурно от алисы нет, но нужно проверить концепт, что не только мне нужен карманный ИИ дружок.
artmel
18.08.2025 15:59Ну пока нет успешных кейсов такого устройства.
да и в текущем формате, есть ли смысл? все это легко делается как программа для смартфона. так как в текущем виде это просто выносной микрофон с неонкой. а проверить на программе гораздо легче чем на железке
azTotMD
18.08.2025 15:59Как-то эксперемнтировали с google coral, запихнули туда довольно большой сегментатор изображений. Работает медленнее, конечно, чем на V100, но не намного, раза в 1.5 - 2, а штука эта размером с мобилу. Вот сила TPU-шек.
LLM, поди всё равно в него не запихнуть, надо подрезать размер. С другой стороны, LLM для чего такое кол-во параметров? Чтобы у неё в весах осела информация на всех языках и обо всём, до чего дотянулись скраперы. Вряд ли юзеру такой штуки нужно больше, чем пара языков.
А вот классическое обучение там уже не сделать, бэкпроп не работает на целых числах, а TPU ускоряет именно перемножение матриц целых чисел. Т.е. тут если только изобретать свои алгоритмы обучения.
Согласен с вашим комментарием выше, что в текущей постановке в этом нет никакого смысла. Без хотя бы инференса на девайсе, нет никакого заявленного автором "Физический. Мой." А сделать инференс языковой модели на портативной железке это тот ещё челлендж.
nikolz
18.08.2025 15:59У этих чипов цена кусачая.
образец чипа RA8P1 от 3000 руб. Отладочная плата от 30 000 руб.
модуль SiWx917M на Али от 6000 руб
модуль nrf9151 на Али от 15000 руб
модуль ESP32C3 на Али от 130 руб
Indemsys
18.08.2025 15:59Ну эт все равно что предложить делать телегу вместо машины, потому что колеса дешевле.
nikolz
18.08.2025 15:59Вы ошибаетесь. Указанные Вами чипы избыточны по вычислительной мощности. Да и брелоки и часы из них будут тяжелыми ( ток потребления RA8P1 1 А.) Вы купите смарт часы за 1000$?
Indemsys
18.08.2025 15:59Не смешите мои наушники.
В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.
Если сложить их пиковые токи, то ампера 2-3 наберется.
А работают неделями.
А так да, RA8P1 не хватает audio DSP и это максимум что можно найти на публичном рынке. Дальше только дороже.
ESP32 тут и рядом не лежат.nikolz
18.08.2025 15:59В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.Если сложить их пиковые токи, то ампера 2-3 наберется.А работают неделями.
Не понял, что смешного Вашим наушникам.
Можете доказать, что работают неделями?
Indemsys
18.08.2025 15:59Мы еще с избыточной мощностью не разобрались.
Наушники смеются с понятия "избыточной вычислительной мощности"
У них самих там на полтора гигагерца набегает и при этом они так себе давят шум, и визжат от сильных звуков.
azTotMD
18.08.2025 15:59Из статьи не очень понятно, что вы делаете.
В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.
подумал, что хотите свою железку с LLM. Типа: микрофон -> сетка для распознания речи -> LLM -> ответ на мониторе.
он учится тебе, а не энциклопедии.
Как будто говорится не только об инференсе, но и обучении.
Но потом фразы:
Связка с телефоном
Сначала ответы из облака
разрушают магию
mike_melanin Автор
18.08.2025 15:59в перспективе собирается твой граф знаний, который будет учитываться в промптинге. Не все же сразу.
artmel
18.08.2025 15:59Графовая база очень требовательна к памяти, которая очень ограниченна у таких устройств.
AppCrafter
Идея интересная. Но вроде уже Сэм Альтман с Джони Айвом такое делают.
mike_melanin Автор
Так это же замечательно!