Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT / forpes.ru

Главная
Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT

Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT +36

17.04.2026 12:00

TrexSelectel 15 15000 Источник

Нейросети стали часто использоваться в творчестве и нашей повседневной жизни. Листая короткий контент, можно наткнуться на фото и видео, где в роли обзорщиков теперь выступают ИИ-аватары — зачастую это сгенерированные изображения людей с синтезированными голосами. Качество этих материалов пока может уступать творениям, созданным человеком, но грань с реальностью постепенно стирается.

В статье посмотрим, какая нейросеть из четырех лучше всего подойдет для генерации изображений. Все познается в сравнении, поэтому приступим!

Начало сравнений

Оцениваться нейросети будут в трех категориях, назовем это раундами. Всего сделаем три раунда:

стандартная генерация изображения с фоном;
генерация очень детального изображения;
способность генерации текста на изображении.

Первый раунд: генерация персонажа-банана

Nano Banana

Начнем с теста: предложим нейросети промт, связанный с бананом. Но вместо обычного фрукта попросим ИИ изобразить «живой и нестандартный» образ.

Промт: «Желтый банан, состоящий в вымышленной организации "ба-на-на" стоит около белой стены разрисованной граффити, в халате, на котором написано название его благотворительной организации, он стоит с доброжелательным лицом, держа в руках аптечку, на голове медицинская шапка»

После обработки запроса система выдала следующий результат:

Получилось неплохо, но нейросеть «посвоявольничила» и добавила несколько деталей на стене — это не критично. Главная проблема — надпись на всю стену: «HELPING HANDS», которой не было в промте. Почему нейросеть добавила эту надпись?

Алгоритм выхватил лишние ассоциации из базы данных, пытаясь визуально интерпретировать промт — технически это объясняется семантическим наложением: в промпте упоминались «благотворительная организация» и «граффити». Нейросеть выстроила ассоциативный ряд и «галлюцинировала» лозунг, перенеся его с халата на стену.

Разработчику стоит поработать над точностью генерации и свести галлюцинации к минимуму. Для пользователя важны предсказуемость и качество, поэтому данному изображению я ставлю 6 из 10 за вышеперечисленные недостатки.

Nano Banana 2

Теперь взглянем на вторую, более новую и усовершенствованную версию — Nano Banana 2. Первая версия показала довольно посредственный результат, который не оправдал возложенные на нее ожидания.

После генерации мы получили следующий результат:

Неплохо. Результат достойный, картинка получилась реалистичной, в отличии от предшественника с его мультяшным стилем. Банан проработан детально и приятен для глаза.

На стене — получилось много граффити, причем большинство из них имеют в себе какой-то смысл или посыл. Но есть один нюанс, вызывающий вопросы к нейросети: почему на тротуаре видны штрихи, напоминающие те же граффити?

Возможно, модель слегка перепутала тротуар и стену. Но есть также другой вариант: нейросеть, благодаря большой базе данных, выяснила, что художники перед нанесением краски, часто, проверяют баллоны перед работой, распыляя краску куда придется, в том числе и под ноги.

Остается два варианта, почему нейросеть так поступила — высокая проработанность и большая база данных, или просто баг генерации. Итоговая оценка: 9 из 10 за хорошую проработанность и приятный для глаза реализм и дизайн.

ChatGPT

В отличие от остальных конкурентов, эта модель отличается хорошо проработанными деталями и качеством изображения, что не может не радовать.

Повторим тот же запрос с «благородным» бананом и посмотрим на результат.

Генерация от ChatGPT выглядит явно лучше, чем у первой Nano Banana и где-то наравне со второй. По качеству она выглядит приятнее и детальнее. Есть пара любопытных моментов. Нейросеть сама добавила расшифровку названия организации «ба-на-на» на халате как дополнение. Хотя прочесть текст целиком сложно, кое-что там все-таки можно рассмотреть, например, слова «бананова» и «нано». Видимо, ChatGPT знает, с кем имеет дело.

Но расшифровка не единственное, на что стоит обратить внимание. Руки по текстуре напоминают молодой картофель. Если приглядеться, можно увидеть черные точки, и светло-коричнево-желтый цвет, который специфичен данному корнеплоду.

Этому изображению я ставлю 8,5 из 10 из-за реалистичности и неплохой детализации, но небольшие недостатки не позволяют получить наивысший балл.

Qwen

Эта модель делает ставку на фотореализм, а не на избыточную детализацию. В генерации изображений реалистичность преобладает над детальностью, но качество генерируемых изображений остается на высоком уровне даже не имея мелких деталей.

Отправляем наш промт и смотрим на результат:

Четвертый участник выдает довольно хороший результат, который может конкурировать с предыдущими. Как я уже говорил выше, у этой нейросети преобладает реализм, поэтому изображение получилось очень реалистичным — даже пугающе — реалистичным.

Рассмотрев фотографию, хочется отметить граффити: оно выглядит приятно, а особенно цепляют символичные рисунки бананов.

Я ставлю этой генерации 10 из 10 за красоту и эстетичность, хоть и присутствует небольшая, но не критичная ошибка в генерации текста на халате.

Вывод по раунду

Все участники справились с задачей достойно, но лидером в этом раунде можно считать Qwen, набравший наивысший балл.

Новые GPU в облаке Selectel от 196,09 ₽/час

Видеокарты для ресурсоемких задач — NVIDIA® H100, H200, RTX™ 6000 Pro.

Подробнее →

Второй раунд: генерация кабины пилота изнутри

В этом раунде проверим нейросети на детализацию. Мы попросим их сгенерировать панель управления в Boeing: на ней расположено множество приборов, индикаторов и переключателей — именно их детальность и проработка нам и нужна.

Порядок нейросетей оставим таким же, как и в первом раунде.

Промт: «Сгенерируй панель управления пилота в самолете модели Boeing и как можно детальнее».

Референс панель управления пилота Boeing 747. Источник. — *Референс панель управления пилота Boeing 747.* *Источник*.