Я – Папа Карло, только вместо Буратино делаю ИИ-кулон / forpes.ru

Главная
Я – Папа Карло, только вместо Буратино делаю ИИ-кулон

Я – Папа Карло, только вместо Буратино делаю ИИ-кулон +9

18.08.2025 15:28

mike_melanin 31 1400 Источник

В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.

Не приложение. Не «навык для колонки». А маленький компаньон, которого можно повесить на шею, прицепить к рюкзаку или кинуть в карман. Который слышит, понимает, запоминает – и не исчезает вместе с закрытием вкладки.

Я давно в технологиях, запускал проекты в робототехнике и AI, но к «железу для себя» почти не прикасался. Всё сдвинулось, когда я увидел попытки вытащить ИИ из телефона и вернуть ему присутствие. Разговор с ИИ перестаёт быть «сеансом связи» и становится постоянным диалогом.

? Дисклеймер: фото и видео в этом посте – из раннего проекта, в котором я участвовал. Мы тестировали гипотезы, но тот проект не полетел. Сейчас собираю новую версию с другим дизайном и подходом.

Что я строю прямо сейчас ?

Рабочее имя: Berry (не финал). Носимое устройство с микрофонами, маленьким экраном и постоянным контекстом.

Сейчас это «цифровой тамагочи на стероидах»: плата, провода, 3D-корпус. Но он уже оживает – реагирует на голос, передаёт аудио, возвращает ответы. Иногда глючит, иногда тупит – это нормально для v0. Главное, это мойкомпаньон, а не чей-то сервер за океаном.

Зачем вообще это всё ?

Присутствие ? – фиксируешь мысль за секунду, без «открой приложение».
Контекст ? – он учится тебе, а не энциклопедии.
Деликатность ? – явная индикация, никакой скрытой записи.
Скорость ⚡ – меньше трения между намерением и действием.

Как это будет работать (v0, черновик) ⚙️

1–2 MEMS-микрофона, AEC/NS/AGC, детект активации.
Связка с телефоном по BLE/Wi-Fi; тяжёлые задачи – через мобильный мост (позже больше на устройстве).
Экран 1–2″ для статуса и коротких подсказок.
Режимы: «заметка», «подскажи», «наблюдатель» – всегда с видимой индикацией.
Сначала ответы из облака, постепенно – больше on-device и приватности.

Чего не будет ?

Тайной записи без индикации.
Агрессивной телеметрии и «продажи внимания».
Слайдовой магии без живых демо – показываю только то, что работает.

Дорожная карта ?️

v0: довести до «ношу целый день» (стабильность, UX-скелет).
Малая бета-партия → отладка → переход на специализированную плату.
Приватность/оффлайн, батарея и форм-фактор – итерациями.

Кому это зайдёт ?

Предпринимателям и креаторам, у которых идеи «сыпятся не вовремя».
Специалистам с плотным днём – важнее не «знать всё», а не забывать своё.
Тем, кто хочет «второго себя» – без цирка, просто чтобы жить и работать легче.

Ищу людей ?‍♂️

Embedded-инженера (edge/audio/hw/LLM): микрофоны → фильтрация → кодек → транспорт → ASR → ответ. Опыт с ESP/STM/Zephyr/RTOS, AEC/NS, BLE/Wi-Fi, мобильным мостом – будет супер.
Потенциального CTO, который возьмёт стек end-to-end: архитектура, прошивка, бэкенд, app-мост, безопасность. Я сфокусируюсь на маркетинге, продажах и инвестициях.
Бета-юзеров, готовых тестировать и ломать.
Наблюдателей, которым интересно смотреть честный дев-лог со взлётами и фейлами.

Дальше будет ?

Это серия заметок – от эскизов и спагетти-проводов до работающего устройства: технические разборы, провалы и победы, честные выводы. Если интересно посмотреть, как ИИ перестаёт быть «ещё одним приложением» и становится частью повседневности – подписывайтесь.

Контакты ?

Telegram: @mike_melanin_live
LinkedIn: linkedin.com/in/mikemelanin

Комментарии (31)

AppCrafter
18.08.2025 15:59
#28723866
Идея интересная. Но вроде уже Сэм Альтман с Джони Айвом такое делают.
1. mike_melanin Автор
  18.08.2025 15:59
  #28727700
  Так это же замечательно!

select26
18.08.2025 15:59
#28723898
Главное, это мойкомпаньон, а не чей-то сервер за океаном.

А для ваших покупателей он опять превратится в "чей-то сервер ". Магия )
1. spc
  18.08.2025 15:59
  #28724342
  А вдруг можно будет у себя дома запускать? Как ownCloud. А, @mike_melanin?
  1. mike_melanin Автор
    18.08.2025 15:59
    #28727706
    в перспективе это все будет на edge, хотя бы на телефоне.

RalphMirebs
18.08.2025 15:59
#28723950
Лет 10 назад был в рунете такой проект Cube (или Кубик, уже не помню точно)
Личный ИИ-помошник, массив микрофонов, никакого облака.. Но шли годы, от автономной работы решили отказаться и превратились в инетозависимого. При этом, тогда ИИ был менее сообразительный. Чем закончилось не помню, я перестал следить после отказа от автономности.
1. spc
  18.08.2025 15:59
  #28724330
  Интересные ребята (и блог на Хабре одно время был), кстати. Я бы даже сказал, очень талантливые, но как-то у них не очень ровно вышло. С Кубика попытались переключиться на носимого ассистента, насколько я помню. С ним не очень вышло, переключились на навыки для виртуальных ассистентов в Штатах. На этом месте я тоже перестал за ними следить, а сейчас заинтересовался и загуглил, и там прямо детектив дальше.
  
  РБК нам сообщает, что их наработки (например, микрофонный массив Кубика) взяли в Яндексе для своих станций. Там же одно время трудился над Алисой и один из основателей Кубика - Юрий Буров.
  
  Мне с ними повезло пообщаться в Москве, еще в самом начале кубика. Потому что они случайно подумали, что я крутой инженер, но ошиблись.
  1. mike_melanin Автор
    18.08.2025 15:59
    #28732118
    я в сша с ним познакомился в коворке амазона - клевый товарищ!

nikolz
18.08.2025 15:59
#28724066
Можно сделать автономный без смартфона: модуль на чипе ESP32+карта памяти.

В брелке BLE модуль на чипе TLSR.
1. WFF
  18.08.2025 15:59
  #28724272
  Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM
  
  И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388
  1. nikolz
    18.08.2025 15:59
    #28725180
    И вот такой https://aliexpress.ru/item/1005009516438849.html?gatewayAdapt=fra2rus&sku_id=12000049341646388
    
    Это не то. В этом решении часы долго не проработают , объем памяти не позволит разместить LLM.
    
    ------------------------
    
    Есть вот такой проект (XiaoZhi AI) например https://www.youtube.com/watch?v=cH77RWhq7AM
    
    Это решение, да и подобные на али требуют подключения к интернет и подписку.
    
    ------------------------
    
    Я написал о возможном решении как в статье.
    
    Брелок будет работать долго так как BLE.
    
    А LLM размещается локально в отдельном модуле , который помещается на пояс и имеет более мощный аккумулятор.
    
    Но прикол в том, что LLM DeepSeek не умеет ходить в интернет и использует информацию на момент его создания т е до 2024 года. Это свойство всех LLM.
    
    mike_melanin Автор
    18.08.2025 15:59
    #28727720
    вы все правильно рассуждаете - за основу для MVP взять поделие китайцев или же форкнуть omi. К сожалению, я больше про продажи и UX - сейчас буду искать технического партнера (текущий отвалился).
  1. vingor
    18.08.2025 15:59
    #28729898
    Так у XiaoZhi все готовое и контроллер под esp32. И Сервера три версии пайтон, жава и еще ктото. Сейчас сам с китайцами поднял тему занимаюсь, адаптацией и русификацией их поделия. Очень большой выбор речь в текст текст в речь и llm
    
    mike_melanin Автор
    18.08.2025 15:59
    #28731386
    давай спишемся в телеге - @mike_melanin - обменяться мыслями и расскажешь что у китайцев готовое раз уже все расковырял.

kenomimi
18.08.2025 15:59
#28724190
Тоже совсем недавно хотел сделать умный кулон/брелок на базе тех круглых экранов с esp32s3... Напечатал корпус, добавил батарею, и в целом даже запустил демо.

Но платформа сама по себе мне не очень нравится - конфиг по сложности на голову превосходит линуксовый, сборка представляет собой магию, почти везде используется чистый С, энергоэффективность никакущая для микроконтроллера...

Фото

Как по мне, проще взять маленький линуксовый чип - софта больше, дров больше, качество кода выше, потребление сравнимое. SoM полно на рынке, разводятся на двуслойной плате легко.
1. mike_melanin Автор
  18.08.2025 15:59
  #28727754
  как с тобой связаться и пообщаться?

Indemsys
18.08.2025 15:59
#28724748
Тут идеально вписывается RA8P1. Для локального ML это наверно самый сейчас эффективный чип по потреблению и скорости.
И такой дивайс должен иметь уже камеру. Детекция лиц там есть в демке.
Микрофонную решетку тоже поддерживает.
Для низкопотребляющего WiFi - SiWx917M
Для глобального подключения как опция - nRF9151
1. mike_melanin Автор
  18.08.2025 15:59
  #28727734
  инференс чистый на девайсе - имхо пока утопия и лишнее усложнение. Про камеры я вообще молчу...
  1. artmel
    18.08.2025 15:59
    #28727906
    На таком девайсе да.
    
    На более мощном нет. смарты вполне справляются.
    
    Но тогда получается ваш девайс такойже приватный и безопасный как яндекс алиса, и обрабатывает и хранит данные где угодно только не в контролирруемом покупателем месте. пока единственное что может потянуть из "дешевого" железа это малинка последняя и пачка ускрителей helio к ней. но опять же это дешево только условно, а жрет хорошо электричество
    
    mike_melanin Автор
    18.08.2025 15:59
    #28731376
    не все сразу - в POC принципиально отличий архитектурно от алисы нет, но нужно проверить концепт, что не только мне нужен карманный ИИ дружок.
    
    artmel
    18.08.2025 15:59
    #28731402
    Ну пока нет успешных кейсов такого устройства.
    
    да и в текущем формате, есть ли смысл? все это легко делается как программа для смартфона. так как в текущем виде это просто выносной микрофон с неонкой. а проверить на программе гораздо легче чем на железке
    
    azTotMD
    18.08.2025 15:59
    #28733352
    Как-то эксперемнтировали с google coral, запихнули туда довольно большой сегментатор изображений. Работает медленнее, конечно, чем на V100, но не намного, раза в 1.5 - 2, а штука эта размером с мобилу. Вот сила TPU-шек.
    
    LLM, поди всё равно в него не запихнуть, надо подрезать размер. С другой стороны, LLM для чего такое кол-во параметров? Чтобы у неё в весах осела информация на всех языках и обо всём, до чего дотянулись скраперы. Вряд ли юзеру такой штуки нужно больше, чем пара языков.
    
    А вот классическое обучение там уже не сделать, бэкпроп не работает на целых числах, а TPU ускоряет именно перемножение матриц целых чисел. Т.е. тут если только изобретать свои алгоритмы обучения.
    
    Согласен с вашим комментарием выше, что в текущей постановке в этом нет никакого смысла. Без хотя бы инференса на девайсе, нет никакого заявленного автором "Физический. Мой." А сделать инференс языковой модели на портативной железке это тот ещё челлендж.

nikolz
18.08.2025 15:59
#28725198
У этих чипов цена кусачая.

образец чипа RA8P1 от 3000 руб. Отладочная плата от 30 000 руб.

модуль SiWx917M на Али от 6000 руб

модуль nrf9151 на Али от 15000 руб

модуль ESP32C3 на Али от 130 руб
1. Indemsys
  18.08.2025 15:59
  #28727082
  Ну эт все равно что предложить делать телегу вместо машины, потому что колеса дешевле.
  1. nikolz
    18.08.2025 15:59
    #28727224
    Вы ошибаетесь. Указанные Вами чипы избыточны по вычислительной мощности. Да и брелоки и часы из них будут тяжелыми ( ток потребления RA8P1 1 А.) Вы купите смарт часы за 1000$?
    
    Indemsys
    18.08.2025 15:59
    #28727546
    Не смешите мои наушники.
    В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.
    Если сложить их пиковые токи, то ампера 2-3 наберется.
    А работают неделями.
    
    А так да, RA8P1 не хватает audio DSP и это максимум что можно найти на публичном рынке. Дальше только дороже.
    ESP32 тут и рядом не лежат.
    
    nikolz
    18.08.2025 15:59
    #28727884
    В них стоят чипы с 8! процессорами в каждом! А они даже в интернет не выходят.Если сложить их пиковые токи, то ампера 2-3 наберется.А работают неделями.
    
    Не понял, что смешного Вашим наушникам.
    
    Можете доказать, что работают неделями?
    
    Indemsys
    18.08.2025 15:59
    #28728716
    Мы еще с избыточной мощностью не разобрались.
    Наушники смеются с понятия "избыточной вычислительной мощности"
    У них самих там на полтора гигагерца набегает и при этом они так себе давят шум, и визжат от сильных звуков.

azTotMD
18.08.2025 15:59
#28729270
Из статьи не очень понятно, что вы делаете.

В какой-то момент я понял: хватит разговаривать с ИИ через стекло. Хочу, чтобы он был рядом всегда. Настоящий. Физический. Мой.

подумал, что хотите свою железку с LLM. Типа: микрофон -> сетка для распознания речи -> LLM -> ответ на мониторе.

он учится тебе, а не энциклопедии.

Как будто говорится не только об инференсе, но и обучении.

Но потом фразы:

Связка с телефоном

Сначала ответы из облака

разрушают магию
1. mike_melanin Автор
  18.08.2025 15:59
  #28732122
  в перспективе собирается твой граф знаний, который будет учитываться в промптинге. Не все же сразу.
  1. artmel
    18.08.2025 15:59
    #28732222
    Графовая база очень требовательна к памяти, которая очень ограниченна у таких устройств.

Я – Папа Карло, только вместо Буратино делаю ИИ-кулон +9

Что я строю прямо сейчас ?

Зачем вообще это всё ?

Как это будет работать (v0, черновик) ⚙️

Чего не будет ?

Дорожная карта ?️

Кому это зайдёт ?

Ищу людей ?‍♂️

Дальше будет ?

Контакты ?

Комментарии (31)

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор

mike_melanin Автор