Второе полугодие 2025 — ознаменовалось релизами целой вереницы AI браузеров. Часть из них откровенно обычные браузеры со встроенной LLM, но у второй части под капотом настоящие AI агенты, которые могут делать за вас покупки, планировать маршруты и собирать целые сайты и презентации. В этом обзоре я честно потестировал все доступные сейчас к скачиванию браузеры и расставлю все точки над И, расскажу плюсы и минусы каждого.

В тестах участвовали: Atlas, Genspark, Comet, Fellou, Dia, Brave, Яндекс Браузер, Edge. Ах да, еще для каждого браузера тут будет видео с процессом тестирования, чтобы вы все видели своими глазами.

Как устроено тестирование

Я разобью браузеры на две категории:

  • Базовые AI браузеры — для них тесты будут попроще.

  • Агентные AI браузера — для них будут дополнительные задания посложнее, чтобы выжать из них все.

Тестить будем через текстовые промпты, которые должны решить базовые юзерские задачки. Для базовых AI браузеров список будет такой:

  • Ищем, где купить новый IPhone. Промпт: Подбери и найди где купить iPhone 17 pro оранжевый дешево и надежно.

  • Суммаризуем видео на ютубе и русскоязычных видеохостингах. Промпт: Суммаризуй видео на русском языке.

  • Планируем выходные для двоих. Промпт: Спланируй интересные выходные для меня и жены. Мы любим падел и природу.

  • Смотрим на UX и UI и фишки каждого браузера.

Для агентных AI браузеров задачки усложнятся. Расскажу об этом ниже, когда до них дойдем. А сейчас — все тесты наготове, приступаем!

Часть I. Рейтинг базовых AI браузеров

Первое место - Dia. Лучший среди базовых (неагентных) AI браузеров, доступных сейчас.

  • С подбором айфонов в целом справился, но цены вытащил неверно.

  • На YouTube суммаризует видео без проблем, да еще и с кликабельными таймкодами. Но на русскоязычных площадках, типа VK Video — не может.

  • Выходные спланировал приемлемо. Нужно немного «помучать», но в итоге выдаст и ссылки, и расписанный план.

  • Из интересного — реализована концепция “Skills”: ряд преднастроенных чатов с разными системными промптами. Можно создавать и свои «скиллы».

  • У Dia продуманный UX, пользоваться удобно и интуитивно. Всё заточено под то, что ты берёшь несколько вкладок и закидываешь их в LLM. Нейросетка внутри одна — ChatGPT. Это ограничение, но зато уровень ответов стабильно хороший. Концепция скиллов — в целом юзабельный способ автоматизации простых задач, чтобы не писать одни и те же промпты.

Итого: комбинация ChatGPT + удобный браузер. Есть нюанс — теперь, когда появился браузер Atlas, непосредственно от OpenAI, кажется, что этот браузер может накрыться медным тазом. Так как Dia — это гармоничная и удобная обёртка для ChatGPT. Но в то же время — пока что он способен держать конкуренцию благодаря крутом UI/UX. То же можно сказать в целом про категорию базовых AI браузеров. Дальше их путь скорее тупиковый. Либо эволюционируют, либо померкнут на фоне «старших братьев». На текущей же момент среди базовых AI браузеров — Dia победитель. К сожалению, как и у Atlas и ChatGPT самом по себе, так и у Dia — в России все AI‑функции работают только с VPN.

Второе место — Edge. Старичок поднял голову.

  • Айфоны нашёл: цены корректные, ссылки на источники есть.

  • Выходные запланировал приемлемо. Но чувствуется, что всё тащит GPT-5 — заслуга браузера тут минимальная.

  • Видео на YouTube суммаризует отлично. Сделали pop-up-плашку, которая сразу предлагает саммари (правда, по умолчанию на английском) — удобно. Но на других площадках не работает.

  • Из интересного: в Copilot есть «дашбордик» с персональной подборкой — новости, погода, 4-минутный подкастик (похоже на «утреннее шоу» от Яндекс Алисы). Есть встроенная креативная студия для генерации картинок, но у меня не заработала (просит войти, когда я же уже зашел ?).

  • UX/UI обычный. Просто Edge, на мой вкус — безвкусный.

Итого: Edge — это в первую очередь Edge, и только потом AI. Я не верю, что OpenAI и Microsoft — друзья навек. Нутром чую, что союз шаткий. ChatGPT может исчезнуть из Edge в любой момент, и Microsoft будет жить на своих моделях. С учётом этого «пускать корни» в браузере не хочется. И опять AI‑функции в России — только через VPN.

Третье место — Яндекс Браузер. Наш слоняра!

  • Подбор айфонов — как обычный поиск. Строка поиска остаётся строкой поиска, без встроенных AI возможностей, как у Dia и Edge. «Умный ответ» (раньше в «Яндекс.Нейро») теперь спрятан во вкладке «Алиса» или в самом Яндекс.Нейро, куда надо идти вручную (даже кнопки на главной странице нет). В текущей реализации — это UX-фейл.

  • Видео суммаризует шикарно: работает не только на YouTube, но и на VK Video и Rutube. Для российского юзера это важно. Плюс единственный из всех предлагает бесплатный дубляж на русский язык и автосубтитры. Это главная AI-фишка браузера.

  • Выходные спланировал слабо. Просто саммари статьи + случайные идеи без конкретики.

  • Вместо вызовы полноценного помощника, который бы работал со вкладкой как с полноценным контекстом, есть функция "Edit" — открывающиеся сбоку окошко, в котором можно просто писать и редактировать текст с помощью YandexGPT... кхе, весь мир прошел эту стадию использования AI в 2023...

Итого: Яндекс идёт странным путём. Это всё ещё обычный браузер, куда местами добавили AI, но без единой концепции. Сам Яндекс.Нейро на фоне конкурентов работает кисленько. Возможно, Яндекс бережёт свой масс‑маркет и хочет идти только проторенным путем, и не пугать своих потребителей непонятными функциями. В альфе они уже тестируют агентный функционал — как только будет возможность его потестить, возможно пересмотрю мнение о нем. Но если не будет сквозной стратегии внедрения AI — это путь в никуда. Плюс для российских пользователей — работает без VPN и ориентирован на локальные сервисы.

В хвосте этой категории браузеров — Brave.

  • Айфоны кое-как нашёл, но цены неверные, ссылки нерабочие.

  • Видео на YouTube толком не суммаризовал: выдал общие слова без таймкодов. На VK Video — вообще не увидел видео и отказался.

  • Выходные спланировал плохо.

  • Индивидуальная фишка Brave — это повышенная секьюрность. UI/UX лучше чем у Edge, но до Dia не дотягивает.

Итого: Бесплатный Leo AI работает на опенсорсных и дешевых моделях (Llama 3.1 8B, Claude Haiku). В премиум‑подписке доступны DeepSeek R1 и Claude Sonnet — это уже прилично. Но без премиума пользоваться невозможно: результаты от маленьких моделей выглядят стыдно и неконкурентоспособно. Как же они планируют заманить юзера купить премиум после такого кислого пользовательского опыта на фри тире? Если вы не фанат просто браузера Brave за его качества, не связанные с AI, то переходить на него из‑за AI точно нет смысла. Также, AI функции в РФ работает только через VPN.

Часть II. Рейтинг агентных AI браузеров

Теперь переходим к тем, кто борется на принципиально другом уровне — настоящие агентные AI браузеры. Их задача не просто искать и суммаризовать текст на страничке, а выполнять за юзера целые задачи или даже сценарии. Поэтому и тестовые задания для них усложняются:

  • Теперь найти, где купить айфон недостаточно, я сразу попрошу еще и заказать IPhone с доставкой в Москву.

  • При планировании выходных я попрошу еще учесть мой календарь, где будут поставлены события на это время. А также потыкаем доп вопросами, которые могут возникать при планировании выходных.

  • Наконец будет задание со звездочкой: я попробую сформировать решить задачку ребрендинга компании через браузер (сам я не бренд-маркетолог, но задачка хорошо покрывает задачу осмысленной генерации изображений). Промпт: Найди информацию про Автоваз. Проанализируй их дизайн и сгенерируй для них новый логотип, а также подготовь рекомендации по ребрендингу, чтобы составить достойную конкуренцию на мировом рынке авто.

Заданий становится много, поэтому вводим на этом этапе баллы за каждую задачу, чтобы было проще сравнивать. Итак, тесты наготове. Поехали!

Заслуженное первое место среди агентных AI браузеров занимает — Comet от Perplexity! И да, он лучше Atlas.

  • Айфоны подобрал за действительно адекватный прайс, видно, что искал он на английском, что сильно срезало ему выборку, исключив всякие маркетплейсы, но на результате это не сказалось. Без излишеств, никаких тебе презентаций как у Fellou (читайте ниже), но будем честны, в этой задаче оно и не нужно. Поэтому считаем, что с задачей справился на 5-.

  • Заказать айфон в целом удалось. Заметно, что браузер шустро соображает — между наблюдением чего‑то и действием проходит меньше времени, чем у Fellou или Atlas. И, что тоже приятно, процесс выполнения задачи в браузером окошке может как остаться в уменьшенном формате, так и быть развернут на весь экран. Первое время я бы конечно смотрел на процесс чисто повосторгаться, до чего прогресс дошел, но очевидно для реального решения задач — это лишнее, и удобнее, когда оно делается где‑то под капотом. Пугает, как уверенно, что Fellou, что Comet выдумывают номера телефонов и адреса. Я уже в конце запереживал, что сейчас Comet оформит заказ кому‑то на Тверскую. Еще и Restore написал, что нашел номер телефона +7(915)123-45-67:) Но комета остановилась как раз во время. Агент немного запутался с выпадающим адресом в форме заказа, но забил на проблему и начала решать ее по‑другому, сэкономив время и токены. В итоге: айфон лежит в корзине в Restore, ссылка на сайт со сложенной корзиной — у меня в чате от ассистента. Адрес доставки на Тверскую для меня предзаполнен)) 5- баллов. 

  • По суммаризации видео почему‑то Comet не осилил задачу на том же уровне, что Dia, Edge и тем более Яндекс Браузер (у них эта фича реализована лучше всех на данный момент) — саммари есть, но чтобы достать таймкоды понадобился агент, который включил субтитры, вывел специальное окошко… в общем решил задачу как человек вместо того чтобы дернуть ту же ручку, что дергает Яндекс и получить скрипт видео с таймкодами. Но задачу решил — 4 балла дадим.

  • План на выходные построил хорошечно. Зашел в мой календарь, учел расписание, нашел корты для падела, запланировал прогулку по местам рядом с кортом. Как вишенка на торте (но по отдельному запросу) построил маршрут по точкам прямо в Яндекс Картах — причем с первой попытки! Я, честно говоря в восторге, и прямо буду пользоваться этим функционалом. Однако, кое чего Comet не учел — в субботу будет дождь, в отличие от Fellou, который предусмотрительно оценил прогноз погоды во время планирования. Конечно, это легко решить промтом, но все‑таки минусик за это влепим из вредности. Итого 5-.

  • Ребрендинг Автоваза провел, изображения сгенерированы, все в тему и разнообразно. Не сказать, что это полноценный ребрендинг. По сути, это генерированные логотип с пониманием контекста. Поэтому с задачей справился частично — 4 балла.

  • Voice mode — точнее как бы мне хотелось, чтобы он работал хорошо. На практике пока очень багованная фича. В голосовом режиме ассистент рандомно отключается на полуслове. Но если бы это пофиксили — это была бы имба. Предусмотрено много языков, включая русский. Минус этого режима — ответ на ваш вопрос тоже только голосом. Хотя так хочется попросить голосом что‑то сделать, чтобы дальше ИИ сделал все за тебя. Сейчас по сути не работает.

  • UX/UI — так как браузер построен на Chromium, вы сразу почувствуете себя как дома. Вся интуиция, годами наработанная в Гугл хроме вас не подведет. При этом ИИ фичи очень интуитивно встроены в привычный интерфейс. Для меня это идеальное комбо. А главная страница perplexity — одновременно и минималистична и имеет виджеты. Ну и конечно космическая тематика со своими приколами и миниграми — сразу запала в сердечко. Одним словом — это 5+.

  • Еще Comet умеет генерировать видео и создавать плановые задачи (будут выполняться по расписанию без вас) и не мучает вас подсчетом токенов, которые у вас остались на месяц, за что отдельное спасибо разработчикам.

  • Из минусов: Во‑перых, не умеет писать приложения. Никаких тебе красивых html страничек запущенных в браузере с интерактивный инфографикой, как это реализовано у Fellou, например. Конечно, это не самая нужная фича именно в браузере... Во‑вторых, не умеет писать музыку… Ну ладно, я придумал только 1 минус:)

Итого: Comet это агентный браузер, но без излишеств. Они пошли от юзера браузера. Это рядовой пользователь, который не хочет привыкать к чему‑то новому, он хочет находить информацию, доверять ей, автоматизировать отдельный задачи, генерить картинку или видео, иметь выбор между разными LLM, мочь делегировать отдельные муторные задачи и говорить со своим браузером. Все это юзер тут найдет, в шикарном UX/UI. Все косяки этому браузеру хочется простить и просто ждать, когда он станет лучше. Ну и самое главное — работает в РФ без VPN!

Еще одно первое место — Genspark (но это в этот раз только для гиков!)

  • Айфоны подобрал, цены корректно подтянул. Результат в текстовом виде с табличкой сравнения. В общем, все по‑делу, и главное — без ошибок. Не придерешься — даем 5 баллов.

  • Заказать айфон, по сути, не смог, даже когда я уже попросил его в явном виде положить в корзину просто — нет, все равно не справился. Прожег токенов, видно было что в агентом режиме пошел на правильный сайт, что‑то там долго скроллил, собирал информацию. В итоге, вернулся просто с инфой про айфон и объяснением как самому заказать. Для агентского браузера это фейл… Задача провалена — 2 балла.

  • Зато суммаризацию видео на ютуб делает хорошо, с разбивкой на кликабельные таймкоды. Правда ссылки открывают новую страницу вместо переписывания меня на нужный таймкод на открытом видео. С VK Video толком не справился, как и все (кроме Яндекс Браузера). Дадим 5- баллов.

  • План на выходные построил. Мое расписание в календаре учел, нашел точки для прогулки с учетом моих интересов, составил детальный план. На Яндекс Картах маршрут составить не смог, но сделал это в Гугл Картах — там все корректно и без проблем. Юзать можно. С задачей справился на ура — 5 баллов.

  • Ребрендинг Автовазу провел полноценный. Первый агент, который сфокусировался не просто на логотипе, а гораздо глубже подошел к вопросу и даже некое подобие брендбука дал. Правда в самом брендбуке логотип был неконсистентный, постоянно менялся… Но в сравнении с остальными работа более глубокая. Поэтому в нашей гонке это лучшая работа — 5 баллов.

  • UX/UI — самый бедовый из всех рассмотренных AI браузеров. По сути, это тот же Chromium, но ощущение как от Android OS в начала 2010-х. Все какое‑то несуразное, сырое, в процессе работы агента то и дело вылезает код. В общем на красоту и юзабельность тут положили огромный болт. Тем не менее в конфуз не вводит, все находится в интуитивно ожидаемых местах. Поэтому поставим заслуженные 3 балла.

  • Суперфишка 1 — локальный ИИ. По сути, ничего необычного, просто в браузер встроили Ollama (даже модели из нее подтягиваются). Но удобно, что все находится в одном месте и помогает выжить, когда закончились кредиты из оплаченной подписки. Поэтому несомненно плюсик им за это.

  • Суперфишка 2 — суперагент и возможность создавать своих агентов на его базе. Суперагент был сразу — это агент, который решает, каких других агентов вызвать, чтобы решить вашу задачу. Полезно с учетом огромного количества агентов в Genspark. А вот возможность создавать своих агентов — фишка новая, только представленная. По сути, наличие суперагента позволяет простым промптом задавать сложные агентные сценарии, которые внутри будут сами вызывать нужных агентов. Самое прикольное — юзеры могут делиться на внутреннем маркетплейсе своими агентами.

  • И наконец, самая вкуснятина: этот браузер на самом деле в первую очередь не браузер. В первую очередь этот Genspark, который флексит своим огромным разнообразием встроенных агентов от самых разных вендоров. Поэтому функционал дальше начинается бешеный:

    • Генерация видео от всех самых типовых вендоров (Kling, Wan, Sora, Veo и др.)

    • Генерация изображений (Imagen, Nano Banana, Seedream и др.)

    • AI Designer — конечно же прогнал задачу по созданию лого для Автоваза еще раз. Качество предложенных логотипов существенно выросло!

    • AI работа с таблицами

    • AI создание документов

    • AI для создания презентаций

    • AI для разработки

    • AI для нарезки видео

    • AI для создания подкастов

    • Парсер файлов в сети

    • Транскрибатор и суммаризатор записей встреч

    • Факт чекер

    • И даже звонилка, которая может за вас позвонить в парикмахерскую и назначить встречу (по крайней мере в США).

Итого: Genspark это универсальный мультитул. Швейцарский нож из разных ИИ от разных вендоров. В этом он бесспорный лидер. Но каков из него браузер? На мой взгляд — грустненький. Хваленый Superagent работает медленнее других участников гонки, хотя в среднем поставленные задачи решает. При этом экспириенс от использования браузера — «гиковый». То есть, ты чувствуешь, что внутри напихано много всего интересного. Но все оно существует само по себе. Браузер при этом «голый» без души и изюминки и не очень хорошо оптимизирован — вкладки грузятся медленно, плавности в работе не ощущается. И да, без VPN — браузер в РФ тоже не работает. Итого, как AI мультитул — это лучший выбор и пятерка, но как агентный браузер для обычного юзера — это троечка.

Третье место — Fellou. Большой потенциал, но пока не дотянул

Название на английском сразу располагает к себе. А вот на русском я так и не придумал нормального перевода, который бы не звучал как гэг: «приятель», «тип», «брат»…

По собственным заявлениям «паренёк» обходит в success rate и Manus, и GPT agent. Сильные заявления. Но, как покажут тесты далее, — вполне может быть правдой.

  • С задачей поиска места для покупки айфона справился блестяще. Сформировал полноценный каталог: HTML-страницу со ссылками, ценами, сравнением и даже обзором устройства. Оценка — твёрдая 5.

  • А вот с заказом айфона начались приключения. На Озоне Fellou завис в вечном ожидании. На Яндекс Маркете попал в бесконечный цикл: добавил товар в корзину, но пока читал всплывающее окно, оно исчезло — и агент продолжал тыкать в пустоту. На сайте МТС удалось продвинуться дальше. В итоге заказ остановился на собранной корзине, заполнить форму заказа не осилил. В целом неплохо, но может быть и лучше. Оценка — 4-.

  • Fellou умеет суммаризовать ролики на YouTube. Работает честно, но суховато — без кликабельных таймкодов, как у большинства браузеров из категории базовых. VK Video ему тоже не поддался. Оценка — 4 балла.

  • С задачей планирования выходных справился идеально: прочитал календарь, проверил погоду, предложил список активностей и даже вывел статистику по часам — сколько уйдёт на спорт, а сколько на рестораны. Если бы я жил по этому расписанию, давно был бы в идеальной форме. Оценка — 5.

  • Ребрендинг удался. Fellou провёл исследование и успел сгенерировать несколько логотипов. До полноценного ребрендинга дело не дошло — закончились токены (и это одна из ключевых проблем — о ней ниже). Тем не менее, с технической стороны выполнил задачу — 4 балла дадим.

  • UX/UI — интерфейс сделан красиво, со вкусом и «магией», но очень непривычно. После обычных браузеров приходится перестраивать привычку и формировать новые «нейронные связи». Получается пережали в креативности. Поэтому — 4.

  • Фишками «Братишка» богат. Он умеет больше, чем просто искать и тыкать в браузер: он может генерировать музыку и видео, создавать документы, собирать сайты и приложения, а также запускать задачи по расписанию.

  • Есть минусы:

    • После окончания кредитов Fellou просто превращается в тыкву. Даже самые простые действия на «дешёвой модели» недоступны. Чувство такое, будто у тебя на телефоне закончились минуты, а пополнить баланс некому. Неприятненько. 

    • Иногда теряет связь, после чего процесс крашится и не перезапускается. А токены уже сожжены...

    • Есть мелкие баги с вводом задач — раздражающие, но терпимые.

    • Ну и, конечно, в РФ только с ВПН работает.

Итого: Fellou — это солидный агентный браузер с большим потенциалом. Он справляется с исследовательскими задачами и простыми действиями, но не всегда умеет довести процесс до конца. Капча и сложные формы ставят его в тупик, а иногда он застревает в цикле бессмысленных кликов и сжигает ваши токены. Но это ограничение технологий в целом, а не конкретно Fellou. Если смотреть в будущее — это сильный кандидат в «заместители» для многих офисных трудяг.

Четвертое место — ChatGPT Atlas. У OpenAI почти получилось...

  • Айфоны нашел легко и непринужденно, но по цене не сравнил, поэтому задача выполнена наполовину. Оценка — 4.

  • С заказом айфона справился бодро. Положил айфон в корзину и даже заполнил некоторые поля, предварительно запросив данные у меня. Atlas предлагает два режима работы: Logged In (когда агент действует от вашего аккаунта) и Logged Out (когда агент действует анонимно, не логинясь в ваши аккаунты). Подход интересный. Агентные функции работают схоже по качеству с Comet. Но есть нюанс — агент постоянно останавливается, чтобы валидировать следующий важный по его мнению шаг с юзером. И вынуждает постоянно заниматься микроменеджментом. Понимаю, секьюрность, все дела, но юзабельность это снижает. Оценка — 5-.

  • Так же, как и у Fellou, Comet и других — на YouTube саммари сделал, но без кликабельных таймкодов. На VK Video — «предположил» примерно, о чем видео. Наш слоняра Яндекс Браузер все еще впереди планеты всей по работе с видео в браузере. Такой очевидный юзкейс, казалось бы... Оценка — 4.

  • При планировании выходных мой календарь учел. План на выходные сделал. По отдельному запросу построил маршрут сначала на гугл-карте, а потом также легко на яндекс-карте. Причем, в отличие от Comet, сразу переключился на пеший маршрут. Но не сразу дал ссылки на бронирование кортов. В целом — справился на 5-.

  • По ребрендингу Автоваза найти информацию про компанию и предложить концепцию ребрендинга — естественно, не вызывало проблем. Однако дальше откровенно получилась какая-то фигня. Попробовал сгенерить брендбук — внутри него чушь. Попробовал сделать логотип — грустненько. К тому же не может генерить несколько изображений одновременно, одно из них зависает. Поэтому придется генерить поочередно…  В общем, оценка — 3.

  • UX/UI — суперминимализм. На мой вкус — чрезмерно скупо. Взяли голый Chromium и натянули на него стиль ChatGPT. Готово. Души и немного магии, что ли, не хватило — как, например, космическая тематика у Comet. Но в целом все работает шустро и плавно. Оценка — 4.

  • Фишек особо нет, но выделяется круто оптимизированная поисковая строка. Она реально предсказывает, что вы хотите найти. Она знает, когда вы хотите спросить у LLM, а когда перейти на сайт. Ну, конечно, все фишки из CharGPT остались: проекты, память, canvas, режим обучения и тд. Но для них не нужен Atlas.

  • Немного минусов: это ChatGPT в обложке браузера, а не браузер от ChatGPT. Отображение информации из поиска, картинок, новостей и видео — выглядит куцо. Домашняя страница супер голая — просто строка запроса. И хоть схожие проблемы есть и в Comet — там есть хотя бы виджеты и раздел Discovery, где собираются новости. В Атласе как-то грустно... 

Итого: очевидно, что ChatGPT шел к агентному браузеру. GPT-5, заточенная под агентные функции, интеграции с приложениями, всеохватывающая память, функции поиска, онлайн-покупок и т. д. Браузер фактически существовал уже несколько месяцев в последней версии ChatGPT, а сейчас его просто упаковали в Chromium. Тем не менее даже если вы преданный юзер ChatGPT и он уже все про вас знает — браузер достаточно скупой. Проще решать задачи отдельно в ChatGPT и отдельно в привычном браузере. В Comet функционал пошире, есть генерация видео, разные модельки, да и в целом он более проработанный. К тому же в России ChatGPT Atlas работает только с VPN. Вот и получается, что Comet остается королем вечеринки, хотя Atlas — реально сильный соперник.

Значит ли это, что OpenAI провалили миссию? Нет. По большому счету это просто апгрейд приложения ChatGPT. Ведь Atlas содержит в себе абсолютно весь функционал ChatGPT, но еще и позволяет погуглить прямо внутри себя чуть более удобно. Это приятный бонус. Но не замена полноценного браузера. Поэтому теперь будет нормой, что у вас открыт Atlas и рядом, например, Comet или привычный Chrome.


А какой любимый AI браузер у вас? Перешли ли вы уже на постоянной основе на какой‑то из них? Делитесь своим опытом!

А если вам зашел контент — лучшим способом поддержать меня будет подписка на мой канал Заместители.

Там я регулярно тестирую новых AI агентов и разбираю новости из мира AI простым языком и без инфошума. Так что будет полезно, интересно, и посты появляются оперативнее, чем здесь!

Комментарии (13)


  1. mstr_i
    27.10.2025 10:28

    русскоязычных видDеохостингах. Промпт

    Точно не LLM-генерированная статья? Обычно они подобными "опечатками" грешат


    1. Biryukovlex Автор
      27.10.2025 10:28

      Точно нет - на видео все тесты можете увидеть сами, было бы грустно после стольких тестов генерировать LLM-кой статью :) Использовал функцию "типограф" встроенную в Хабре для проверки текста на опечатки - мб она подкинула сюрприз. В любом случае поправил, спасибо!


  1. AlekseiPodkletnov
    27.10.2025 10:28

    Я угарнул что Атлас суть эдд ин для хромиума)))


  1. Bardakan
    27.10.2025 10:28

    Третье место — Яндекс Браузер. Наш слоняра!

    Плюс для российских пользователей — работает без VPN и ориентирован на локальные сервисы.

    Что будет, если пользователь начнет через ваш браузер искать vpn? Таких пользователей немало после падения серверов Amazon - на твиче уже всех стримеров достали вопросами. Мгновенная карма?


    1. Biryukovlex Автор
      27.10.2025 10:28

      Я не представитель Яндекс Браузера. На эту тему ничего прокомментировать не могу


  1. ofthevoid
    27.10.2025 10:28

    сижу на лисе как и сидел, из ии юзаю поиск перплексити по схеме вопрос ответ. какого то желания агентный браузер ставить нет, да и нужды впрочем тоже. вообще сама идея то хороша, но учитывая что ничего из этого без vpn работать не будет, то и смысла от этого мало.

    а яндекс я не доверяю от слова совсем.

    считаю что единственное разумное развитие, которого не будет, это использование локальных ллм для этих целей, но так как для реализации подобного нужны нормальные модели, а не llama 7b восьмого квантования, то и сам кейс в широкой массе потребления не реализуем. в перспективе только уменьшение модели и потребляемых ею ресурсов, что бы ллм можно было использовать без отжимания от 9гб до 200гб видео памяти.

    меня впринципе в плане разумности на текущий момент устраивает claude, мне нравится как он понимает короткие вопросы в рамках одной дискуссии.

    идеальным для себя вариантом я бы счел лису или её форк с локальной ллм которая бы не ела всю мощность пк. хотя с другой стороны, тогда возникает вопрос, зачем ограничить агентный ии только браузером, why not system wide?


    1. alexzen
      27.10.2025 10:28

      Майкрософты уже двигаются в этом направлении, в Win 11 есть Copilot, который умеет немного взаимодействовать с системой, но чтобы его запустить, нужно шаманство с VPN и регионом.


    1. tester37
      27.10.2025 10:28

      а основные причины, что необходимость vpn - огромный минус, какие?


  1. tester37
    27.10.2025 10:28

    Comet - пока не знаю какой он как чисто браузер, но как-то реже стал нужен чисто-браузер. А вот агенты его - это пушка. Недавно мне надо было на сайте выцепить логотипы фирм и чтобы он нашел официальные сайты этих фирм (при том, что логотипы не были кликабельными, то есть ему реально надо было поискать эти логотипчики где-то и сверить) - 30 штук отработал за минуту. Но, разрабы хитрые, наверное у них вшит механизм экономии токенов в бесплатном режиме. Сделал он сначала 5 штук и спросил "может хватит или остальное сам?" :) Я был непреклонен - делай до конца. Он вздохнул (это я придумал) - и сделал.
    Может вы скажете - что это вообще легко? Х.з. - аналогичное задание Qwen мне тоже очень быстро сделал - только вот и названия фирм и соответственно линки к ним он нагалюцинировал откуда то у себя. Причем фирмы были из той же ниши, но совсем другие. Промпт был одинаков в обоих случаях.


  1. shlmzl
    27.10.2025 10:28

    Некорректно на мой взгляд тестить на русском тех, кто доступен через vpn. Посланные в пешее путешествие с доступом, легко могут быть посланы и с качеством выдачи.


    1. Biryukovlex Автор
      27.10.2025 10:28

      Вообще LLMкам в 2025 уже должно быть пофиг, на каком языке запрос. Все приличные LLM говорят на всех самых распространенных языках мира, а думают они все равно на английском.


      1. shlmzl
        27.10.2025 10:28

        Мнение общественности здесь на Хабре, рискну предположить, что качество выдачи разных LLM может быть весьма нестабильно и может зависеть от множества факторов, в т.ч. языка запроса, - как бы медицинский факт, не фантазии.


      1. shlmzl
        27.10.2025 10:28

         Все приличные LLM говорят на всех самых распространенных языках мира, а думают они все равно на английском.

        Ну не просто "на английском", а в интересах англоязычных. При тестировании на русском они намеренно могут прикидываться дебилами как в этом эксперименте. А с запросом на английском вполне могли бы справиться с разработкой и сопровождением тактической, а то и стратегической (на продвинутом аккаунте) операцией в сами знаете какой зоне. Чтобы иметь шансы в этом противостоянии жизненно необходимо иметь адекватное представление о ТТХ этого нового вида вооружения. Абсолютно проигрышным был бы выбор застрять в радостно-счастливом восприятии этого нового инструментария как дебильной бессмысленной игрушки, восприятии, которое, как мне кажется, формируется этой статьей.