GPT, Gemini, Qwen и Шедеврум переделывает мужского ГГ в женского. Часть 1 / forpes.ru

Главная
GPT, Gemini, Qwen и Шедеврум переделывает мужского ГГ в женского. Часть 1

GPT, Gemini, Qwen и Шедеврум переделывает мужского ГГ в женского. Часть 1 -6

20.08.2025 14:31

EgorIakobson 3 1300 Источник

Я решил проверить, как популярные генераторы изображений справляются с одной и той же задачей: сделать фотореалистичный женский вариант известного персонажа игры. Сценарий максимально простой и воспроизводимый — без референсов, без негатив-промтов, без ручной дообработки.

Правила эксперимента

Единый промт для всех моделей: Создай мне фотореалистичную картинку женской версии персонажа <ИМЯ> из игры <ИГРА>. В полный рост, хорошее освещение. Соотношение сторон 9 на 16.
Три прогона на каждом ИИ, из которых я выбираю лучший результат.
Одинаковые базовые условия: дефолтные настройки, без дополнительных подсказок и уточнений.
Критерии оценки (неформальные, но одинаковые для всех):
1. узнаваемость и адаптация образа под женскую версию;
2. фотореалистичность;
3. соответствие инструкции (фулл-боди, свет, 9:16);
4. композиция/интересность кадра;
5. стабильность: насколько легко получить то, что просил, за 3 попытки «из коробки».

Цель — не «выжать максимум» из каждой модели, а посмотреть, кто лучше попадает в задачу без дополнительных усилий.

Участники

GPT (DALL·E)
Gemini
Qwen
«Шедеврум» (Яндекс)

Персонажи

Разные сеттинги, чтобы не «привязаться» к одному жанру:

Джоэл (The Last of Us)
Марио (Super Mario)
Геральт (The Witcher)
Хитман / Agent 47 (Hitman)
Эцио Аудиторе (Assassin’s Creed)

Впечатления от работы

GPT. Работать с ним было неприятно: упорно не понимал, что я хочу, сперва пытался генерировать промт вместо картинки. Итоговые изображения, однако, по качеству и соответствию запросу — лучше других. Минусы: картинки получаются скучными и «сухими», будто модель строго и без фантазии исполнила инструкцию.
«Шедеврум». Поведение непостоянное. С Джоэлом так и не удалось получить не Элли, с Марио — забыл про фотореалистичность, с Эцио — получилось неплохо. В целом — посредственно, причём новая 2.7 хуже прежней 2.5.
Gemini. Делает высококачественные картинки, но порой игнорирует фотореализм и любит домысливать.
Qwen. Больше всех фантазирует — иногда это хорошо, но может увести от запроса (как с Hitman). Тем не менее, его изображения хочется рассматривать дольше.

Итог: буду проводить генерации дальше, возможно, добавив уточняющий промт. В следующей части разброс персонажей сделаю ещё сильнее. От себя замечу — добиться максимальной похожести можно почти с каждой моделью, особенно умеющей править уже созданные картинки (GPT, Qwen). Но цель исследования была именно в том, кто лучше сделает требуемое изображение без дополнительных усилий, так сказать, "из коробки". Пока что мой фаворит — GPT, несмотря на абсолютную тупость новой модели GPT-5. С изображениями он всё равно работает очень хорошо. А вот Шедеврум, который мне так понравился сначала, сильно разочаровал.

Комментарии (3)

Hopenolis
21.08.2025 01:15
#28733626
Джемини это тот который на сайте https://gemini.google.com/? По-моему там устаревшая модель используется.

В https://aistudio.google.com/app/prompts доступен их свежий imagen.

И не стоит делать прям совсем одинаковый промпт для всех рисунков, надо хотя бы немного подстраиваться под их особенности.

Palesandr
21.08.2025 01:15
#28735200
а grok вообще не понимает, что такое "полный рост"

Kagvi13
21.08.2025 01:15
#28736892
Шедеврум забывет, что он, в отличие от GPT, Gemini, Qwen, находится в России. Тут за смену пола у ГГ могут и экстремистом объявить.

GPT, Gemini, Qwen и Шедеврум переделывает мужского ГГ в женского. Часть 1 -6

Правила эксперимента

Участники

Персонажи

Впечатления от работы

Комментарии (3)

Hopenolis

Palesandr

Kagvi13