Создать своего виртуального двойника сегодня можно без камеры, студии и продакшена. Достаточно одного фото и пары инструментов. В итоге получается персонаж, который похож на вас, говорит вашим голосом и подходит для Reels, Shorts, TikTok, презентаций и обучающих видео.

Меня зовут Паша Захаров. Уже много лет занимаюсь диджиталом, стратегиями и развитием 360 проектов. Сейчас все больше углубляюсь в ИИ, и пытаюсь сделать свою рабочую жизнь проще.

Сегодня постарался подготовить и структурировать для вас гайд, в котором рассказал о том, как создать своего виртуального персонажа от фото до финального ролика.

Поехали.

1. Создаём визуальный образ персонажа

Задача — получить устойчивое и узнаваемое изображение по вашему фото.

Сервисы, которые подойдут лучше всего

Leonardo AI — реалистичные портреты, отлично удерживает черты лица.

Как работать:

  • Берите фронтальное фото.

  • Загрузите в Leonardo.

  • Сгенерируйте 10–20 вариантов.

  • Выберите 2–3 наиболее аккуратных.

Промпт:

Составь промпт для реалистичного портрета по фото. Ровный свет, натуральные цвета кожи, нейтральная мимика.

Midjourney — если нужен художественный стиль, «кинокадры».

Промпт:

A realistic portrait of a person with [описание], natural soft light, detailed skin texture, clean background, 85mm lens look.

PhotoMaker — когда нужно много вариаций лица с сохранением внешности.

2. Пишем короткий сценарий

Даже ролик на 20 секунд лучше воспринимается, если у него есть структура.

Запрос в GPT:

Напиши короткий сценарий ролика (до 25 секунд). Стиль — разговорный. Структура: зацепка — мысль — вывод.

Как скопировать стиль понравившегося ролика

  • скачать текст ролика через downsub.com

  • дайте GPT текст и запрос:

Проанализируй стиль автора и сформулируй правила, по которым мне писать свои ролики, подготовь похожим сценарий

3. Голос в ElevenLabs

Голос влияет на восприятие сильнее визуала.

Варианты:

  • записать свой голос (30–60 секунд);

  • выбрать голос и тембр в библиотеке.

Промпт:

Перепиши текст простыми фразами, короткими предложениями, добавь паузы.

4. Чистка в Audacity

Очень удобный инструмент, чтобы скорректировать от любых звуком до голоса.

  • убрать тишину

  • удалить щелчки

  • шумоподавление

  • лёгкая компрессия

  • громкость +1–2 dB

Голос становится чище и стабильнее.

5. Делаем говорящего AI-персонажа

Это ключевой этап. Ниже — актуальные инструменты + что с ними делать + настройки + рабочие промпты.

HeyGen — речь и мимика

Для чего:

  • речь

  • синхронизация губ

  • крупные планы

  • естественные движения лица

Плюсы:

  • лучший результат при озвучке

  • стабильное лицо

  • мягкая мимика

Минусы:

  • не делает движение камеры

  • мало движений тела

Что делать:

  • объяснения

  • советы

  • приветствия

  • короткие монологи

Промпт:

Перепиши текст короткими фразами для синхронизации губ.

Настройки:

  • Create Video → Upload Photo → включить Face Enhancement

  • Audio → Upload Voice → выбрать Voice Sync: Performance

  • Video Settings:

    • Eye Contact: Medium

    • Blinking: Natural

    • Mouth Movement: Balanced

  • Экспорт:

    • 1080p

    • 24 fps

    • Compression: Medium

Runway — сцены без речи, лёгкие движения

Для чего:

  • присутствие персонажа

  • повороты головы

  • лёгкие движения

  • эстетичные кадры для переходов

Плюсы:

  • плавная анимация

  • атмосферные сцены

Минусы:

  • не подходит для речи

Промпт:

A person standing by the window, soft daylight, slight head movement, calm expression.

Настройки:

  • модель Gen-2

  • Image Input → Add Image → включить Preserve Details

  • Motion:

    • Camera Motion: Subtle

    • Subject Motion: Low

    • Stabilization: On

  • Lighting: Soft Warm

  • Экспорт: 1080p / 24 fps

Pika — короткие акценты и движения

Для чего:

  • поворот головы

  • поднятие взгляда

  • лёгкий жест

  • динамичные вставки

Плюсы:

  • быстрые движения

  • добавляет динамику

Минусы:

  • не для речи

Промпт:

Close-up, slight head turn, natural light, smooth motion.

Настройки:

  • модель Pika 2

  • Motion Type: Subtle

  • Motion Speed: 0.4–0.6

  • Face Refinement — включить

Sora — окружение, движение камеры, атмосфера

Для чего:

  • вступления

  • финальные сцены

  • окружение персонажа

  • движение камеры как в живой съёмке

Плюсы:

  • реалистичная камера

  • мягкий свет

  • атмосферные переходы

Минусы:

  • не работает с мимикой

Промпт:

Handheld camera shot of a person walking on a quiet street during sunset, warm daylight, soft shadows, realistic motion.

Настройки:

  • Duration: 6–8 секунд

  • Camera Motion: Smooth Forward

  • Handheld Shake: Low

  • Depth of Field: On

  • Lighting: Natural Warm

  • Формат: 9:16

6. Генерируем дополнительные кадры

Чтобы ролик не был однообразным, используйте вставки:

  • предметы

  • атмосферные сцены

  • короткие визуальные метафоры

Промпт:

cinematic frame, warm soft light, shallow depth of field, natural tones, [описание сцены]

7. Монтаж в CapCut

  • длительность роликов: 15–30 секунд

  • переходы: fade или dissolve

  • выравнивание цвета между кадрами

  • голос громче музыки на 3–5 dB

  • короткие субтитры

Итог

Готовая цепочка выглядит так:

  • фото → визуальный образ (Leonardo / Midjourney / PhotoMaker)

  • GPT → сценарий

  • ElevenLabs → голос

  • Audacity → чистка звука

  • HeyGen → речь

  • Runway / Pika / Sora → движения и сцены

  • Midjourney / Leonardo → дополнительные кадры

  • CapCut → монтаж

Получается персональный AI-двойник, который выглядит естественно, говорит вашим голосом и подходит для любых форматов видео.

Спасибо от меня, что дочитали! Надеюсь, было полезно. До скорых встреч.

Комментарии (2)


  1. programania
    09.12.2025 17:49

    Тоже сделал анимацию фото с речью, но без НС
    и не видео, а бесконечно в браузере с webGL.
    Все движения определяются программно в JS.
    Как можно расшевелить картинку анимацией 2D можно увидеть в
    https://prog-mania.github.io/fani/
    Habr добавляет что-то к ссылке. Это нужно удалить.
    Там чтобы браузер разрешил звук нужно пометить "Говорить".


  1. Alex-Freeman
    09.12.2025 17:49

    https://prog-mania.github.io/fani/

    Особенно понравилось, когда глаза по лицу начинают двигаться, боюсь теперь не смогу заснуть) Хотя спорить не буду, прикольно сделано