ИИ и автоматизация — это цунами, которое обрушится завтра, смывая отрасли и экономики. Его можно либо интегрировать в свои ресурсы, либо погрузиться в зависимость от облачных гигантов.
Я столкнулся с этой болью: ИИ-inference стоит дорого. А почему мои неиспользуемые GPU от майнинга не могут стать платой за него?
Концепция: P2P-инфраструктура на базе MoE
"ИИ-торрент" — это децентрализованная P2P-сеть для inference ИИ-моделей. В её основе три ключевых принципа:
BitTorrent-экономика. Узлы сети (от домашних ПК с GPU до серверов) обмениваются вычислительными ресурсами на равных. Делишься GPU — получаешь бесплатный/приоритетный доступ. Не делишься — платишь. Деньги идут тем, кто делится.
Архитектура «Умный рой» (Mixture of Experts). Вместо запуска одной гигантской модели, сеть состоит из множества специализированных "экспертов" (слой или подмодель, 1–5 ГБ). Децентрализованный роутер динамически распределяет фрагменты запроса по сети для параллельного выполнения.
Самоорганизующийся интеллект. Популярные модели органически мигрируют на самые активные ноды. Комбо-эксперты из разных репозиториев (типа HuggingFace) могут объединяться, создавая emergent-свойства и мощные гибридные ИИ без зависимости от облачных монополий.
Как это работает для разных участников
Для пользователей без вычислительных ресурсов
Взаимодействие организовано через стандартный API или чат-интерфейс. После установки клиента (exe-инсталлятор для Windows, аналог для macOS/Linux или мобильное приложение) и подключения крипто-кошелька (встроенный, с опцией покупки токенов через карту) пользователь вводит промпт ("сгенерируй код на Python для анализа данных"), выбирает модель (Llama-3, Mistral или гибрид) и подтверждает микротранзакцию в utility-токенах. Децентрализованный роутер автоматически распределяет запрос по 3–5 ближайшим узлам, возвращая результат за 200–500 мс. История запросов сохраняется локально или в IPFS, обеспечивая анонимность без централизованных аккаунтов и подписок.
Для пользователей с вычислительными ресурсами (сидеров)
Клиент активирует пассивный режим "майнинга". Сеть сканирует idle-мощности (>50% свободно) и регистрирует устройство как узел в P2P-сети (через DHT-протокол). При поступлении запросов от других пользователей ваш узел получает фрагменты задач, выполняя inference и накапливая utility-токены пропорционально вкладу (по метрике FLOPS или обработанных токенов вывода). Встроенный дашборд отображает доход, статистику и опции стейкинга для повышения приоритета, обеспечивая пассивный заработок без ручного вмешательства.
Для создателей ИИ-моделей
Разработчик загружает модель (в формате HuggingFace) через API или веб-интерфейс в децентрализованное хранилище (IPFS с torrent-like seeding). Сеть автоматически разбивает её на "эксперты" (слои) для MoE-роутинга, тестирует на бенчмарках и присваивает метки специализации. Роялти (5–10% от стоимости каждого запроса) начисляются автоматически через смарт-контракты. Дашборд отображает аналитику по использованию и доходам, позволяя монетизировать свои разработки напрямую, без посредников.
Экономика: токенизированная модель обмена
Экономика "ИИ-торрента" построена на utility-токенах (AIT), стоимость которых привязана к рыночной цене вычислений и будет снижаться по мере роста сети, стремясь быть на порядок дешевле централизованных аналогов.
Распределение доходов: 70% — сидерам, 20% — разработчикам моделей (роялти), 10% — в DAO-фонд для развития протокола.
Ликвидность и стабильность: Токены торгуются на DEX (например, Uniswap), а волатильность минимизируется через стейкинг (дающий приоритет в сети) и частичное обеспечение резервами в стейблкоинах (USDC).
Рост сети: DAO может субсидировать "публичные" ноды для исследований или бесплатных лимитов (free-tier), ускоряя привлечение пользователей на раннем этапе.
Аналоги: существующие проекты в децентрализованном ИИ
Идея не нова. Несколько проектов уже доказали, что P2P-inference работает. "ИИ-торрент" стремится взять лучшее из существующих решений.
Проект |
Описание |
Сходства с "ИИ-торрентом" |
Отличия |
Petals |
P2P-сеть для distributed inference LLM, где модель разбивается на слои, каждый на домашнем ПК. |
Torrent-like обмен слоями, шардинг, фокус на idle-ресурсах. |
Нет встроенной экономики; больше для энтузиастов. |
Bittensor (TAO) |
Децентрализованный рынок ML с 32+ специализированными подсетями; узлы "майнят" выводы. |
MoE-роутинг по подсетям, токенизированная экономика, миграция моделей по прибыльности. |
Более сложная архитектура, фокус на training + inference. |
Gensyn |
DePin-протокол для ML-compute с верификацией вычислений на блокчейне. |
Обмен ресурсами за токены, распределенное выполнение. |
Больше ориентирован на training (GPT@home), чем на быстрый inference. |
Render (RNDR) |
Децентрализованная GPU-сеть, изначально для рендеринга, теперь и для AI/ML. |
Idle-GPU как ноды, токенизация (RNDR за FLOPS). |
Исторический фокус на графике, более централизованный роутинг. |
Эти проекты доказывают, что децентрализованный ИИ — это уже многомиллиардная индустрия. Наша цель — взять их лучшие механики и сфокусироваться на одной задаче: сделать inference доступным, быстрым и дешевым для всех.
Вызовы: реалистичные барьеры и как их обойти
Децентрализованные системы хрупки. Вот ключевые вызовы и наши гипотезы для их решения.
Вызов |
Почему болит |
Решение в "ИИ-торренте" |
Latency в P2P |
Глобальная сеть = 200–800 мс задержки + 50–100 мс на MoE-роутинг. |
Geo-DHT + edge-кэширование (запрос к 3 ближайшим нодам). Цель: <300 мс. |
Приватность данных |
Промпты летят по чужим нодам, что создает риски утечек. |
Zero-knowledge proofs (ZK-SNARKs) для верификации вывода без раскрытия данных; токенизация и обработка промпта локально. |
Вредоносные ноды |
Один "отравленный" эксперт может подсунуть фейковый результат. |
Slashing (штраф токенами за низкую точность); репутация on-chain (Elo-рейтинг); выборочная перепроверка 1% запросов. |
Регуляции (EU AI Act) |
С 2025 года GPAI-модели требуют аудита и прозрачности. |
Используем только open-source модели; DAO обеспечивает авто-генерацию отчетов о рисках и предвзятости. |
Стабильность сети |
На старте мало нод, что приводит к очередям и медленной работе. |
Bootstrap-гранты от DAO для первых 100 000 нод; интеграция с Telegram/Discord ботами для вирусного роста. |
Эти вызовы — не стены, а чек-лист для MVP. Решаем 80% на старте (ZK + geo-routing), остальное — в roadmap.
Заключение: от концепта к революции вычислений
«ИИ‑торрент» — это не просто P2P‑хак, а фундаментальный сдвиг к демократизации ИИ. Глобальные idle‑вычислительные ресурсы (GPU/CPU/NPU) — это «тёмная материя» compute, способная затмить существующих гиперскейлеров, контролирующих 63% рынка. Децентрализованная сеть может мобилизовать в 10–20 раз больше мощностей, снижая стоимость вычислений на порядки и делая ИИ по-настоящему общедоступным.
Этот концепт — не финальный чертеж, а приглашение к штурму
Комментарии (26)

user-book
12.11.2025 03:57ох уж эти влажные фантазии
цифровой коммунизм, точнее коммунизм вычислительных мощностей
и не взлетит по тем же причинам - тупое но наглое меньшинство будет пользоваться результатами работы большинства, нарушая работу всей системы
классическое "ачетакова" отдельных индивидумов и "халявные мощности" для больших компанийдаже если пытаться натянуть для малых групп где все друг-друга знают, все равно посыпется рано или поздно по все те же социальным причинам
и никакая монетизация не поможет так как это будут пытаться обойти в первую очередь

mozg4d Автор
12.11.2025 03:57"влажные фантазии" звучит как мой любимый жанр, но да, фрирайдеры и "ахетакова" — вечная классика P2P, от торрентов до кооперативов. Ты прав, социалка рушит даже малые группы, а монетизацию хакнут первыми. Но здесь не коммунизм, а рынок с зубами: токены за каждый токен вывода + slashing (штрафы за фигню) + репутация on-chain, как в Bittensor (они уже пережили такие атаки и выросли до $2.5B). Корпо-халява? KYC-стейкинг для больших нод, чтоб не фармили. Не идеал, но MVP на Petals показывает — если incentives работают, меньшинство не сожрёт всех

user-book
12.11.2025 03:57вот яркий пример крипта. Она уже давно чисто пузырь на уровне ценных бумаг.
Крипту не приняли как ожидалось, а наоборот подрезали и впихнули в существующую систему. Тут будет то же самое
торент взлетел потому что он оказался реальным win-to-win меж пользователями. Никаких обязательств, все просто и быстро. И главное нельзя насаждать рекламу или висуры, только если пользователь сам такой торент скачает.
Собственно потому и пытаются запретить торенты с переменным успехом, потому что они не влазят в рамки сущестующей системы, а подрезать не выходит потому что там и так уже все максимально просто, только добавлять свои ограничения
Старая как мир классика, с которой мы сталкиваемся с первых дней - в конфликте хулигана и жертвы власть всегда прессует жертву потому что это проще. создать под такое законодательство и процессы сложно, максимум обмажут лицензиями из-за чего оно совершенно потеряет первоначальную задумку

qw1
12.11.2025 03:57slashing (штрафы за фигню)
А если вредоносный узел, получив задание на проверку, ошибочно обвинит добросовестного клиента, и наложит штраф? Кто будет проверять проверяющих?
Чтобы нормально разобрать кто прав, кто нет, надо логировать все задания и ответы, а это огромный объём хранилища, да и нарушит конфиденциальность.

Siddthartha
12.11.2025 03:57а что там братья либерманы замутили? видел как они рассказали в интервью о своей реализации этой идеи в оупенсорсе, но так и не нашел что именно

mozg4d Автор
12.11.2025 03:57Да, в чем-то похоже, но как понял то что они делают - не для простых смертных, они ориентированы на h100+ без тоо чтобы разбивать модели на экспертов и динамически распределять этих экспертов по нодам в зависимости от возможности нодов. С одной стороны можно сказать что они думают на шаг вперед, что типа ноды очень быстро подрастут и "майнинг" на видеокартах станет не актуален (как было с биткоином) но с другой, я хочумайнить ради токенов, для доступа к мощному ии, так что это вопрос больше не мощностей, а объёма покрытия пользователей. Но на всякий случай я точно не знаю что именно они пытаются делать. Возможно и они тоже - сейчас ситуация очень динамична, и все адаптируются

Siddthartha
12.11.2025 03:57я тоже так понял что не для дешевых карточек) но я тупо ссылку не могу найти. они заявляют, что код ноды уже опубликован, а где собственно?))

riky
12.11.2025 03:57А что тут делать без h100 ? Llama 13b q4 запускать? :)
Гонять промежуточные данные между слоями мне кажется бесперспективно медленно, разве что ориентироваться на тех у кого есть оффлайн задания на генерации, не чаты, тогда смысл есть...
mozg4d Автор
12.11.2025 03:57Это был один из первых вопросов который я задал ии. Я тоже думал что "шардить" модели дело бесперспективное - слишком много данных пересылать между нодами, но оказалось что это не так, даже если модель изначально не разбита на относительно независимых экспертов, то ее возможно так разбить, и такие решения уже существуют. И задержки получаются приемлемыми. Кстати не помешала бы система разбиения модели и для локального использования, например чтобы 4 3060 постпвить и получить 48 гигов видео памяти например

rivo
12.11.2025 03:57IPFS уже выстроили базу для хранения данных. IPVM (The InterPlanetary Virtual Machine) позволяет запускать собственные вычисления на узлах используя WebAssembly CoD(Compute On Data). Любой желающий может подключить свою ноду и получать процент от транзакций. Нода предоставляет пруфы, что надежность и вычислительная мощьность соответствуют. Требования к ноде гораздо выше чем к торрент сидеру, точно не помню, но минимальные превосходят среднестатистический ПК. Вроде как уже запускают stablediffusion на основе IPVM, но я не следил что там получилось https://docs.ipfs.tech/concepts/cod/#bacalhau
Глобальные idle‑вычислительные ресурсы
Для компаний выделяют гранты, строят им персональные электростанции, выдают rtx 9000 100500GB со скидкой. p2p выглядит интересно для мини провайдеров или пользователей которые хотят получить независимость от монополистов/регуляторов. По качеству услуг, ну сомнительно что сможет конкурировать с датацентром.

mozg4d Автор
12.11.2025 03:57мда.. потыкал.. Это для гиков через CLI. совсем не то что нужно, нужен нормальный, удобный вэб интерфейс, как AI studio или подобный, у каждой модели может быть свой интерфейс.

riky
12.11.2025 03:57Представьте у вас moe , один эксперт пусть 30гб и в сети карточки по 8гб это минимум 4 карточки для просчёта одного токена. И 5 пересылок по сети. Очень грубо, но производительность будет порядка 1сек на токен (5 пересылок плюс время всем на инференс). У вас в чате все уснут уже...
Для cli как раз вариант, для тех у кого скриптами надо пачку задач посчитать и время не важно, главное цена
mozg4d Автор
12.11.2025 03:57Да, мы считали с ИИ, ваши цифры - излишне пессимистичны, у нас получалось в среднем 10 сек на ответ для чата. Тут не так однозначно - есть разные задачи, некоторым важна срочность, некоторым не особо, для некоторых нужно много нодов, для других мало, поэтому для любых нодов может найтись работа, но срочные задачи будут решаться на серьезных нодах и такие ноды и будут зарабатывать больше всех.
Да и пользователи могут слайдером указывать, у них в приоритете скорость, или экономия (расход utility токенов)

NutsUnderline
12.11.2025 03:57Проект слишком похож на «пиратский»
нейминг наше все. я вот вообще не понял причем пиратство, но слово торрент по сути уже является синономом пиратства. Да и биткоин - такое себе. а от блокчейн и p2p вроде модно молодежно еще.
по сути проекта. когда то seti@home запустили на добровольных началах и оно как то даже работало. но как только к технологии прикручивают деньги то сомнения возникают сами собой. Что ситуация с nft, что история с chia, что МММ - кото успел хапнуть, а дальше - не волнует. даже pr подобной штуки сейчас надо делать очень деликатно и грамотно.
и наверное не прибивать гвоздями к ИИ. Именно что - распределенных вычислений

mozg4d Автор
12.11.2025 03:57Да, тоже с ии обсуждал - нужно ли вообще делать токены ликвидными (торгуемыми на бирже) это сложный вопрос. Есть +++ и ——. В конечном счете скорее всего технология описанная в статье появится и возможно у нее будет несколько групп разработчиков и суровая реальность в том что с высокой вероятностью победит и займет весь рынок та команда которая сделает токены ликвидными.

Bardakan
12.11.2025 03:57Почему болит
Промпты летят по чужим нодам, что создает риски утечек.
Решение в "ИИ-торренте"
Zero-knowledge proofs (ZK-SNARKs) для верификации вывода без раскрытия данных; токенизация и обработка промпта локально.Статья сгенерирована ИИ? Вы данные отсылаете на произвольную ноду, возможно злоумышленника. Шифрование защищает только канал передачи данных, но на самой ноде должны быть ключи для расшифровки данных (иначе модель не сможет с ними работать). Соответственно что мешает ноде прочитать ваши конфиденциальные данные?

mozg4d Автор
12.11.2025 03:57В создании статьи участвовали несклько ии. Но все куонцепты - мои.
Мне как конечному пользователю все равно что кто-то видит мои промпты, даже хорошо - пусть модели на них обучаются и запоминают все про меня, ато каждый раз все заново обьяснять - напрягает. (но профессионально делать память лучше через личный локальный кэш, или распределенно)
Но передавать промпты в "чистом" виде - не профессилнально. Нет такого что ноду обязательно присылать весь промпт в исходном виде. Он может получать "анонимизированные" векторы. Правда нода может понять о чем был запрос по тому какой output он сгенерировал, но и тут можно что-н придумать

BugM
12.11.2025 03:57Не взлетит.
То что приемлемо работает на домашней видеокарте ничего не стоит. То что не работает недоступно для массового развертывания дома.
Это утверждение не зависит от доступных домашним видеокартам мощностей.

mozg4d Автор
12.11.2025 03:57хмм. не поспоришь, сейчас Flux запускаю локально за 3060, но думаю есть шанс что открытые качественные модели генерации видео сокро появятся
cry_san
Разве Дуров не тоже самое продвигает?
mozg4d Автор
Не видел, а есть ссылка?
cry_san
https://habr.com/ru/news/961310/
вроде это
mozg4d Автор
Хмм... Да, это прям оно..