
В первой части мы разобрали основы: как строить промпт, почему важны детали и как стиль влияет на результат. Вы уже знаете, что лисёнок
— это не то же самое, что маленький рыжий лисёнок с пушистым хвостом, покрытым инеем, медленно шагающий по заснеженной поляне
. Но что, если вам нужно не просто похожее изображение, а именно тот лисёнок, которого вы видите в голове, — с определённым ракурсом и композицией?
Эта часть статьи — про понимание того, как Midjourney обрабатывает запросы на техническом уровне. Мы погрузимся в механизм работы операторов позиционирования и разберём, как устроено управление весом элементов.
Язык промпта: почему английский часто работает лучше
Небольшой, но важный нюанс, который стоит учитывать при работе с Midjourney: нейросети чаще лучше понимают промпты на английском языке. Это не предрассудок, а техническая особенность современных моделей.
Дело в том, что большинство нейросетей, включая Midjourney, обучаются преимущественно на англоязычных данных. Объём англоязычных данных в обучающих наборах значительно превосходит данные на других языках.
Например, запрос лисёнок в зимнем лесу
и его английский аналог a small fox cub in a winter forest
могут дать разные результаты. Английский промпт часто обеспечивает более точную детализацию и лучшее соблюдение композиции. Различие особенно заметно в сложных сценах и при использовании специфической терминологии.
Почему так происходит? В английском языке существует более развитая терминология для описания визуальных элементов, освещения и композиционных приёмов. Слова вроде rim lighting
, bokeh
, golden hour
имеют чёткие визуальные ассоциации в обучающем наборе, тогда как их русские аналоги могут быть интерпретированы менее точно.
В этой статье мы будем использовать промпты как на русском, так и на английском языках для наглядности. Русский поможет вам понять логику построения запроса, а английский покажет, как добиться максимальной точности.
А теперь мы переходим к основной «начинке» нашей статьи.
Продвинутое управление весом элементов: оператор ::
Оператор ::
— один из самых мощных, но при этом ещё и непонятых инструментов в Midjourney. Он позволяет точно расставить приоритеты между элементами промпта, но работает не так, как кажется на первый взгляд. Давайте разберёмся, как он устроен и как его правильно использовать.
Как это работает?
Минуточку внимания! В этой статье мы будем писать десятичные числа через точку (как в программировании).
Midjourney интерпретирует промпт, анализируя значимость отдельных слов и фраз. По умолчанию все токены имеют вес 1.0. Когда вы добавляете после слова/словосочетания/группы ключевых слов параметр :: 2
, вы удваиваете этот вес до 2.0. (А в то же время начинаете новую группу параметров — да, оператор ::
фактически разделяет промпт на отдельные группки.) Внутри системы эти веса нормализуются, чтобы их сумма составляла определённое значение, и затем определяют, какие визуальные паттерны будут активированы сильнее.
Советую придерживаться рекомендаций: минимальный приоритет — 0.1, максимальный — 5.0 (крайне сильный акцент). Но на практике оптимальный диапазон — 0.5–2.5. Значения вне этого диапазона часто приводят к искажениям или неестественному доминированию одного элемента над другими.
Например: лисёнок:: 2 фон:: 0.7
. Здесь система понимает, что лисёнок должен быть в центре внимания (вес 2.0), а фон — второстепенным (вес 0.7). (Обращаем внимание на особенности синтаксиса: слева от ::
пробела нет, справа он есть, а после числа-веса не пишется запятая — хотя даже если поставить, то она, скорее всего, просто проигнорируется. Но соглашусь, что формат не самый очевидный.)
Многоуровневое управление приоритетами
В сложных сценах приходится управлять несколькими элементами одновременно. Допустим, у нас есть сцена с лисёнком, бабочкой и осенним лесом. Как расставить приоритет?
Для сцены с лисёнком и бабочкой:
-
лисёнок:: 2.0 бабочка:: 1.3 лес:: 0.8
— лисёнок доминирует, бабочка заметна, лес фоновый.лисёнок:: 2.0 бабочка:: 1.3 лес:: 0.8
лисёнок:: 1.0 бабочка:: 1.8 лес:: 0.7
— бабочка становится центральным элементом.
Если вы задаёте вес для части фразы, то её не нужно заключать в скобки.
лисёнок в шапке, бабочка:: 2, лес:: 0.7
— здесь вес 2 будет применён к обеим «сущностям» предыдущей группы, то есть и лис, и бабочка будут весить «двойку».
Взаимодействие с параметром --stylize
Уровень стилизации влияет на то, как система интерпретирует приоритеты. Также отмечу, что по умолчанию --stylize
равен 100. Указывать параметр нужно только при необходимости изменения уровня креативности.
Таким образом, при низком --stylize
система ближе к буквальному пониманию веса — если вы указали лисёнок:: 2
, она сделает лисёнка визуально доминирующим, но без творческой интерпретации.
При высоком же --stylize 700
система начинает более свободно интерпретировать вес. Тот же лисёнок:: 2
может привести не просто к увеличению размера лисёнка, но и к добавлению дополнительных деталей, подчёркивающих важность лисёнка.
Пример:
С
лисёнок:: 2 фон:: 0.7 --stylize 100
— лисёнок крупнее, фон бледнее.С
лисёнок:: 2 фон:: 0.7 --stylize 700
— лисёнок не только крупнее, но и с более детализированным мехом, яркими глазами, в то время как фон становится более абстрактным.
Рекомендация: при высоком
--stylize
используйте немного меньшие веса (1.5–2.0 вместо 2.0–2.5), так как система в любом случае добавит творческой интерпретации.
И присмотритесь к важному факту, что все «ключи» (отметки на --
) можно ставить лишь в самом конце промта (иначе Midjourney выдаст ошибку), причём между ними запятая не ставится. Например: лисёнок:: 2 фон:: 0.7 --no текст --stylize 700 --ar 16:9
Практический кейс: осенняя сцена с лисёнком
Допустим, нам нужно создать сцену, где лисёнок играет с бабочкой в осеннем лесу, но бабочка должна быть заметным, но недоминирующим элементом.
1. Начинаем с базового промпта:лисёнок в осеннем лесу, бабочка рядом --ar 16:9 --v 7
Получаем изображение, где лисёнок и бабочка конкурируют за внимание.
2. Добавляем веса:лисёнок:: 2.0 бабочка:: 1.2 осенний лес:: 0.8 --ar 16:9
Теперь лисёнок доминирует, но бабочка всё ещё заметна.
3. Анализируем результат: бабочка слишком мала, теряется на фоне.лисёнок:: 1.8 бабочка:: 1.5 осенний лес:: 0.7 --ar 16:9
Снижаем вес лисёнка, повышаем бабочку — получаем баланс.
4. Финальная настройка с учётом стилизации:лисёнок:: 1.7 бабочка:: 1.4 осенний лес:: 0.6 --ar 16:9 --stylize 650
Продвинутая работа с композицией: от теории к контролю
Композиция — это не просто расположение объектов в кадре. Это язык, на котором изображение говорит со зрителем. И если вы хотите, чтобы Midjourney говорил на этом языке правильно, нужно научиться писать промпты, которые передают не только «что», но и «как».
Управление глубиной через промпт
Midjourney отлично реагирует на описательные и стилистические фразы, поэтому я приведу пару примеров работающих формулировок:
shallow depth of field, background blurred
— создаёт эффект боке.mist between layers, distant trees as silhouettes
— добавляет атмосферную перспективу.bokehh, f/1.8, creamy background
— усиливает размытие.
Дам совет: чем больше вы используете визуально насыщенные описания, тем выше шанс получить глубину.
Например:a red fox in sharp focus, fallen leaves in soft focus in the midground, distant trees fading into autumn mist
(рыжая лиса в фокусе, опавшие листья в мягком фокусе на среднем плане, далёкие деревья, растворяющиеся в осеннем тумане
)
Свет и тень: как задать настроение
Свет — главный инструмент создания настроения и объёма. Midjourney не измеряет углы света, но узнаёт типы освещения по названиям и описаниям.
Эффективные световые сигналы:
backlight, rim light from the left
— контровой свет;soft golden hour light, long shadows
— вечернее освещение;dappled sunlight through trees
— световые пятна в лесу;cinematic lighting, high contrast
— драматический свет;volumetric lighting, god rays
— лучи света в тумане.
Совет: комбинируйте источники:soft ambient light with strong backlight, rim light highlighting fur
(мягкий рассеянный свет с сильной подсветкой, подсветка ободка подчёркивает мех
)

soft ambient light with strong backlight, rim light highlighting fur
Композиция: как «намекнуть» на расположение
Вы не можете точно указать, где должен быть объект, но можете направить внимание с помощью контекста.
Работающие приёмы:
a fox on the right side of the frame, looking into the distance
(лиса в правой части кадра, смотрящая вдаль
) — может сместить объект вправо.empty space on the left, subject gazing into the void
(пустое пространство слева, субъект смотрит в пустоту
) — создаёт динамику.wide shot, small figure in the lower third
(широкий кадр, маленькая фигурка в нижней трети
) — работает в сочетании с--ar 16:9
.
Чтобы увеличить шансы, вы можете:
Использовать
--v 7
или--niji
с--style raw
для большего контроля.Добавить
dynamic composition, balanced asymmetry, leading lines
.
Практический кейс: осенний лес
Давайте создадим сцену с лисёнком в осеннем лесу.
1. Начнём с базы:a fox in an autumn forest, golden leaves, soft light --ar 16:9 --v 7
(лиса в осеннем лесу, золотые листья, мягкий свет --аr 16:9 --v 7
)

Такой промпт даст неплохой результат, но он будет нейтральным: лис может оказаться по центру, фон — одинаково чёткий, свет — плоский. Нет акцента, глубины или истории.
2. Теперь построим более улучшенную версию:a red fox in sharp focus on the right side of the frame, gazing into the distance, shallow depth of field, fallen leaves in soft focus in the midground, distant trees fading into mist, backlight from the left creating a golden rim on fur, dappled sunlight through canopy, cinematic lighting, autumn forest --ar 16:9 --v 7 --stylize 600
(рыжая лиса в резком фокусе в правой части кадра, смотрящая вдаль, небольшая глубина резкости, опавшие листья в мягком фокусе на среднем плане, отдалённые деревья, теряющиеся в тумане, подсветка слева, создающая золотистый ободок на меху, солнечные блики сквозь кроны деревьев, кинематографическое освещение, осенний лес --ar 16:9 --v 7 --stylize 600
)

Разберём, зачем каждая часть нужна и как она влияет на результат:
1) a red fox in sharp focus
Акцент на главном объекте. Слова sharp focus
помогают модели понять, что лис должен быть чётким, а не размытым.
2) on the right side of the frame, gazing into the distance
Направляет расположение. Хотя Midjourney не гарантирует точное позиционирование, такие фразы повышают шансы, что объект окажется не по центру, а сбоку — что создаёт динамику.
3) shallow depth of field
Классический термин из фотографии. Midjourney узнаёт его и часто отвечает размытием фона, имитируя эффект боке.
4) fallen leaves in soft focus in the midground
Описывает средний план. Слова soft focus
и midground
помогают создать слоистость: не весь фон одинаково размыт, а есть переход от чёткого переднего плана к более мягкому среднему.
5) distant trees fading into mist
Добавляет атмосферную перспективу. Туман (mist
) — мощный инструмент для передачи глубины. Деревья не просто размыты, а «исчезают» в дымке — что создаёт ощущение пространства.
6) backlight from the left creating a golden rim on fur
Конкретное описание света. backlight
(контровой свет) и golden rim
(золотистый ореол) — устойчивые визуальные паттерны, которые модель хорошо знает по фотографиям и кино.
7) dappled sunlight through canopy
Световые пятна сквозь листву. Эта фраза вызывает ассоциации с лесом в солнечный день, добавляет текстуру и живость. Часто даёт красивые блики и тени.
8) cinematic lighting
Обобщающий стилистический сигнал. Эта фраза поднимает общее качество освещения — делает его более выразительным, контрастным, «как в фильме».
9) --stylize 600
Средне-высокий уровень стилизации. Достаточно высокий, чтобы добавить художественной выразительности, но не настолько, чтобы модель ушла от промпта.
Продвинутые параметры и их комбинации: технический гид
Параметры в Midjourney — это не просто опции, а математические рычаги управления процессом генерации. Понимание их внутренней работы превращает случайность в контроль. Давайте разберём, как именно численные значения влияют на результат и как их комбинировать для достижения конкретных целей.
--stylize и --chaos
Мы уже косвенно рассмотрели параметр --stylize
,нy а теперь разберёмся более подробно:
Параметр --stylize
(сокращённо --s
) определяет, насколько сильно нейросеть отойдёт от буквального прочтения промпта в сторону художественной интерпретации.
Данный параметр работает в диапазоне от 0 до 1000 — и вот что происходит на разных уровнях:
0–100: буквальная интерпретация. Система стремится максимально точно следовать промпту. Полезно для технических визуализаций.
100–300: Умеренная стилизация. Сохраняется точность, но добавляется немного художественной свободы.
400–700: Оптимальный диапазон для большинства творческих задач. Хороший баланс между контролем и креативом.
800–1000: Высокая стилизация. Система активно добавляет элементы, которых нет в промпте, что может привести к неожиданным, но интересным результатам.
Пример: для промпта лисёнок в зимнем лесу
с --stylize 1000
система может добавить сказочные элементы (светящиеся глаза, необычные узоры на снегу), в то время как --stylize 700
сохранит реализм, но с более выразительной передачей текстур.

лисёнок в зимнем лесу --stylize 1000

лисёнок в зимнем лесу --stylize 700
Параметр --chaos
управляет вариативностью между четырьмя вариантами в гриде. При --chaos 0
все варианты почти идентичны, при --chaos 100
— радикально разные. Оптимальный диапазон — 10–40 для большинства задач.
Комбинации параметров
Параметры не просто складываются — они взаимодействуют нелинейно. Например, высокий --stylize
с низким --chaos
даёт контролируемую креативность, в то время как высокие значения обоих параметров часто приводят к хаосу.
Удачная комбинация: --stylize 700 --chaos 30
.
--stylize 700
: достаточно креатива без потери контроля.--chaos 30
: вариативность для поиска лучшего варианта.
Неудачная комбинация: --stylize 900 --chaos 70
.
Слишком много свободы приводит к потере узнаваемости объекта.
Нейросеть начинает генерировать элементы вне контекста.
Высокая вероятность артефактов и неестественных форм.
Также небольшой совет, не стоит забывать про --style raw
— вашего друга при работе с промптами. Он снижает «автоматическую» стилизацию и даёт больше контроля. Но имейте в виду: --style raw
поддерживается в версиях Midjourney v6 и выше. В более ранних версиях его использование игнорируется.
Практический кейс: зимний лисёнок
Задача: создать реализованное, но выразительное изображение лисёнка в зимнем лесу для обложки книги.
1. Начальный промпт:лисёнок в зимнем лесу --v 7

Результат слишком шаблонный, не хватает глубины и деталей.
2. Добавляем базовые параметры:лисёнок в зимнем лесу --v 7 --stylize 400 --chaos 20

Стало уже лучше. Пробуем дальше.
3. Усиливаем детали через веса и параметры:лисёнок:: 2 в зимнем лесу, детали меха, иней на усах --v 7 --stylize 500 --style raw --chaos 25

Мех стал более детализированным, но не хватает «изюминки».
4. Финальная настройка:лисёнок:: 2 в зимнем лесу, детали меха, иней на усах, мягкий утренний свет --v 7 --stylize 550 --style raw --chaos 20

Итог: изображение сохраняет реализм, но с художественной выразительностью, идеальное для обложки. Каждый параметр был выбран осознанно, с пониманием его математической роли в процессе генерации.
Помните: параметры — это инструменты, а не волшебные палочки. Их сила раскрывается только в сочетании с качественным промптом и пониманием того, как они работают под капотом. Экспериментируйте, анализируйте, корректируйте — и вы превратите Midjourney в надёжный, творческий инструмент.
Надеюсь, данная статья оказалась полезной для вас и каждый нашёл для себя что-то новое и полезное. Спасибо за прочтение!
durnoy
Что интересно, запрошенный иней на устах в последних картинках так и не получился. На мехе есть, а на усах не видно.