Создать своего виртуального двойника сегодня можно без камеры, студии и продакшена. Достаточно одного фото и пары инструментов. В итоге получается персонаж, который похож на вас, говорит вашим голосом и подходит для Reels, Shorts, TikTok, презентаций и обучающих видео.
Меня зовут Паша Захаров. Уже много лет занимаюсь диджиталом, стратегиями и развитием 360 проектов. Сейчас все больше углубляюсь в ИИ, и пытаюсь сделать свою рабочую жизнь проще.
Сегодня постарался подготовить и структурировать для вас гайд, в котором рассказал о том, как создать своего виртуального персонажа от фото до финального ролика.
Поехали.
1. Создаём визуальный образ персонажа
Задача — получить устойчивое и узнаваемое изображение по вашему фото.
Сервисы, которые подойдут лучше всего
Leonardo AI — реалистичные портреты, отлично удерживает черты лица.
Как работать:
Берите фронтальное фото.
Загрузите в Leonardo.
Сгенерируйте 10–20 вариантов.
Выберите 2–3 наиболее аккуратных.
Промпт:
Составь промпт для реалистичного портрета по фото. Ровный свет, натуральные цвета кожи, нейтральная мимика.
Midjourney — если нужен художественный стиль, «кинокадры».
Промпт:
A realistic portrait of a person with [описание], natural soft light, detailed skin texture, clean background, 85mm lens look.
PhotoMaker — когда нужно много вариаций лица с сохранением внешности.
2. Пишем короткий сценарий
Даже ролик на 20 секунд лучше воспринимается, если у него есть структура.
Запрос в GPT:
Напиши короткий сценарий ролика (до 25 секунд). Стиль — разговорный. Структура: зацепка — мысль — вывод.
Как скопировать стиль понравившегося ролика
скачать текст ролика через downsub.com
дайте GPT текст и запрос:
Проанализируй стиль автора и сформулируй правила, по которым мне писать свои ролики, подготовь похожим сценарий
3. Голос в ElevenLabs
Голос влияет на восприятие сильнее визуала.
Варианты:
записать свой голос (30–60 секунд);
выбрать голос и тембр в библиотеке.
Промпт:
Перепиши текст простыми фразами, короткими предложениями, добавь паузы.
4. Чистка в Audacity
Очень удобный инструмент, чтобы скорректировать от любых звуком до голоса.
убрать тишину
удалить щелчки
шумоподавление
лёгкая компрессия
громкость +1–2 dB
Голос становится чище и стабильнее.
5. Делаем говорящего AI-персонажа
Это ключевой этап. Ниже — актуальные инструменты + что с ними делать + настройки + рабочие промпты.
HeyGen — речь и мимика
Для чего:
речь
синхронизация губ
крупные планы
естественные движения лица
Плюсы:
лучший результат при озвучке
стабильное лицо
мягкая мимика
Минусы:
не делает движение камеры
мало движений тела
Что делать:
объяснения
советы
приветствия
короткие монологи
Промпт:
Перепиши текст короткими фразами для синхронизации губ.
Настройки:
Create Video → Upload Photo → включить Face Enhancement
Audio → Upload Voice → выбрать Voice Sync: Performance
-
Video Settings:
Eye Contact: Medium
Blinking: Natural
Mouth Movement: Balanced
-
Экспорт:
1080p
24 fps
Compression: Medium
Runway — сцены без речи, лёгкие движения
Для чего:
присутствие персонажа
повороты головы
лёгкие движения
эстетичные кадры для переходов
Плюсы:
плавная анимация
атмосферные сцены
Минусы:
не подходит для речи
Промпт:
A person standing by the window, soft daylight, slight head movement, calm expression.
Настройки:
модель Gen-2
Image Input → Add Image → включить Preserve Details
-
Motion:
Camera Motion: Subtle
Subject Motion: Low
Stabilization: On
Lighting: Soft Warm
Экспорт: 1080p / 24 fps
Pika — короткие акценты и движения
Для чего:
поворот головы
поднятие взгляда
лёгкий жест
динамичные вставки
Плюсы:
быстрые движения
добавляет динамику
Минусы:
не для речи
Промпт:
Close-up, slight head turn, natural light, smooth motion.
Настройки:
модель Pika 2
Motion Type: Subtle
Motion Speed: 0.4–0.6
Face Refinement — включить
Sora — окружение, движение камеры, атмосфера
Для чего:
вступления
финальные сцены
окружение персонажа
движение камеры как в живой съёмке
Плюсы:
реалистичная камера
мягкий свет
атмосферные переходы
Минусы:
не работает с мимикой
Промпт:
Handheld camera shot of a person walking on a quiet street during sunset, warm daylight, soft shadows, realistic motion.
Настройки:
Duration: 6–8 секунд
Camera Motion: Smooth Forward
Handheld Shake: Low
Depth of Field: On
Lighting: Natural Warm
Формат: 9:16
6. Генерируем дополнительные кадры
Чтобы ролик не был однообразным, используйте вставки:
предметы
атмосферные сцены
короткие визуальные метафоры
Промпт:
cinematic frame, warm soft light, shallow depth of field, natural tones, [описание сцены]
7. Монтаж в CapCut
длительность роликов: 15–30 секунд
переходы: fade или dissolve
выравнивание цвета между кадрами
голос громче музыки на 3–5 dB
короткие субтитры
Итог
Готовая цепочка выглядит так:
фото → визуальный образ (Leonardo / Midjourney / PhotoMaker)
GPT → сценарий
ElevenLabs → голос
Audacity → чистка звука
HeyGen → речь
Runway / Pika / Sora → движения и сцены
Midjourney / Leonardo → дополнительные кадры
CapCut → монтаж
Получается персональный AI-двойник, который выглядит естественно, говорит вашим голосом и подходит для любых форматов видео.
Спасибо от меня, что дочитали! Надеюсь, было полезно. До скорых встреч.
Комментарии (2)

Alex-Freeman
09.12.2025 17:49Особенно понравилось, когда глаза по лицу начинают двигаться, боюсь теперь не смогу заснуть) Хотя спорить не буду, прикольно сделано
programania
Тоже сделал анимацию фото с речью, но без НС
и не видео, а бесконечно в браузере с webGL.
Все движения определяются программно в JS.
Как можно расшевелить картинку анимацией 2D можно увидеть в
https://prog-mania.github.io/fani/
Habr добавляет что-то к ссылке. Это нужно удалить.
Там чтобы браузер разрешил звук нужно пометить "Говорить".