Привет, Хабр! Меня зовут Катя, я продакт-менеджер в Lenta Tech («Группа Лента»). Сегодня хочу рассказать о том, как цифровой клон покупателя помогает сделать персональные офферы с конверсией в лиды.

В крупном ретейле персонализация давно стала обязательным минимумом, но на практике она часто упирается в грубые сегменты и массовые акции «для всех». Покупатель чувствует, что рассылка сделана не под него, и просто перестает реагировать.

В статье расскажу о новом витке развития персонализации с использованием больших языковых моделей, а именно — как можно построить «цифровой клон» клиента на основе его чеков и поведенческих данных и использовать его для создания узконаправленных офферов. Разберем архитектуру решения, проблемы, с которыми мы столкнулись, и результаты, которые принесли рост продаж и охватов среди нашей аудитории.

Подходы к формированию офферов в ретейле

Сегодня в ретейле можно выделить два основных подхода к формированию офферов: от полностью ручных до основанных на больших данных.

  1. Ручные правила и сегментация людьми

    Маркетинг и аналитики задают сегменты по возрасту, региону, частоте покупок, категориям, например, «частый покупатель кофе» или «семья с детьми». Для каждого сегмента разрабатываются шаблонные предложения: скидка на любимую категорию, акция на сопутствующие товары и так далее.

    Плюсы такого подхода — понятность, прозрачность и быстрый старт. Минусы — грубая персонализация, высокая ручная нагрузка и медленная адаптация к изменениям поведения.

  2. Классические модели машинного обучения

    Они позволяют строить прогнозы вероятности отклика, вероятности покупки категории, модели следующего лучшего предложения, а также товарные рекомендации на основе истории транзакций. Модели обучаются на исторических данных и автоматически подбирают, кому и что предложить, исходя из целевых метрик: оборот, маржа, частота визитов.

    Плюсы здесь — лучшее качество персонализации по сравнению с ручными правилами и масштабируемость. Минусы — требуется значимая инфраструктура и команда специалистов по ML, ограничены интерпретируемость и гибкость, а также сложнее отвечать на нестандартные вопросы.

Наша Служба Продвинутой Аналитики (СПА) совместно с отделом CRM торговой сети «Гипер Лента» успешно апробировала новый третий подход персонализации, который базируется на больших языковых моделях.

Большая языковая модель получает на вход ограниченную историю чеков и дополнительные атрибуты клиента, а затем формирует структурированный «портрет»: кто он, как живет, какие у него привычки и потребности.

На выходе получается цифровой клон — текстовое и структурное представление клиента, которое можно расспрашивать и использовать для генерации идей акций и рекомендаций.

Плюсы и минусы цифрового клона
Плюсы и минусы цифрового клона

В этой статье разберем кейс использования именно третьего подхода — цифрового клона клиента на базе большой языковой модели, развернутой локально в инфраструктуре ретейлера.

Что такое цифровой клон клиента

Под «цифровым клоном» мы понимаем искусственный интеллект, который по данным о покупках и другим внутренним данным строит расширенный и скорректированный профиль клиента: привычки, домохозяйство, ценовой уровень, возможные скрытые потребности.

Задача ИИ — превратить сырые транзакции в осмысленные выводы, которыми можно управлять из прикладных систем: CRM, платформы лояльности, системы триггерных коммуникаций.

На практике это выглядит так:

  1. Берется история чеков клиента за определенный период и общие данные о нем, затем они передаются языковой модели с продуманной текстовой инструкцией (промптом).

  2. Модель формирует детальный профиль клиента и «объяснения», на основании каких паттернов покупок сделаны выводы.

  3. Далее эти профили используются для настройки персональных акций и сценариев общения.

Из чего состоят данные о клиенте

В исходных транзакционных данных ретейла по одному клиенту обычно содержится история чеков и частота визитов.

Для каждого чека фиксируются:

  • дата и время покупки;

  • канал покупки (офлайн, доставка, самовывоз и так далее);

  • город и адрес магазина.

Для каждой позиции в чеке хранятся:

  • название товара;

  • категория и ее идентификатор;

  • ценовой сегмент (условная шкала от эконом до премиум);

  • скидка на товар;

  • количество (штучно или в килограммах для весового товара).

Для построения профиля мы остановились на интервале в 90 дней с момента последней покупки, чтобы учесть актуальные привычки.

Клонирование: от чеков к профилю клиента

После подготовки чеков начинается процесс «клонирования» — превращения данных в цифровой профиль.

Процесс клонирования
Процесс клонирования

Сбор промежуточных профилей по временным окнам

Для каждого клиента и каждого временного окна в 90 дней формируются «локальные» профили по набору ключевых атрибутов:

  • Социодемографические характеристики: возрастная группа, пол, семейный статус, количество взрослых и детей в семье, возраст и пол детей, наличие и количество питомцев, виды питомцев и т.д.

  • Предпочтения: какие товары и категории наиболее значимы для клиента, какие блюда клиент готовит из данных товаров и т.д.

  • Одновременно фиксируются обоснования: какие категории товаров и паттерны поведения привели модель к тем или иным гипотезам. Полученные ответы по товарам и категориям проходят через обязательный мэтчинг с продуктовым каталогом компании.

Нормализация и разрешение конфликтов

Анализируются конфликтные значения, полученные в разных вопросах (промптах) к клиенту, и применяются правила их разрешения — выбираются наиболее частотные и логически обоснованные версии атрибутов.

Если нет преобладающей версии, атрибут помечается как «неизвестно», чтобы не вводить систему в заблуждение.

Формирование итоговой таблицы профиля

Для каждого клиента строятся две таблицы:

  • о выявленных атрибутах клиента;

  • о выявленных предпочтениях клиента к товарам и категориям.

Итоговые данные экспортируются для дальнейшей аналитики и использования в бизнес-процессах, а именно — для запуска рекламных кампаний.

Проблемы исходных данных и зачем тут вообще ИИ

Реальные клиентские профили в ретейле далеки от идеала:

  • Анкетные данные могут быть неполными или неверными (ошибки при заполнении, намеренные искажения).

  • Покупки по одной карте могут совершать несколько человек, например, члены семьи или друзья.

  • Исторические данные могут содержать шум и редкие нестандартные покупки, которые не отражают реальное поведение.

Классические подходы к сегментации и даже машинное обучение не всегда хорошо справляются с такими «грязными» профилями. 

Большая языковая модель, обученная понимать контекст и причинно-следственные связи, позволяет извлечь из тех же чеков больше смысла: понять, кто с какой вероятностью стоит за этими покупками, как устроено домохозяйство и где находятся скрытые точки роста выручки.

Результаты пилота

В рамках пилотных запусков CVM-кампаний с использованием цифрового клона в «Гипер Ленте», охвативших более 1 миллиона активных клиентов, были достигнуты следующие результаты:

  • Рост товарооборота порядка 15%;

  • Рост маржинальности порядка 11%;

  • До +30% отклика на клиентские коммуникации по сравнению с базовыми сценариями.

Полученные результаты показывают, что использование языковых моделей дополняет классические ML- и uplift-модели, усиливая их за счет повышения релевантности взаимодействия с клиентом.

Почему это важно для ретейла сейчас

Рынок ретейла становится всё более конкурентным, а покупатель — всё чувствительнее к нерелевантному шуму. Использование больших языковых моделей для построения цифровых клонов клиентов позволяет не просто улучшить метрики отклика, но и глубже понять структуру спроса и реальное поведение домохозяйств.

Дальнейшее развитие подхода — масштабирование на большую клиентскую базу и расширение круга задач, которые можно решать через «расспрос» цифрового клона.

А вы пробовали использовать LLM для персонализации в своих продуктах? С какими неожиданными проблемами столкнулись?

Комментарии (2)


  1. lazarus_net
    29.04.2026 08:22

    • Рост товарооборота порядка 15%;

    • Рост маржинальности порядка 11%;

    • До +30% отклика на клиентские коммуникации по сравнению с базовыми сценариями.

    Хотелось бы деталей.

    Допустим вы создали цифровой клон меня. Что не так сложно, поскольку я скидочной картой пользуюсь, соответственно все мои покупки известны продавцу.

    Дальше что вы мне предложите?

    Я покупаю продукты определенных брендов, скажем в категории домашнее хозяйство.

    Не потому что большой фанат, просто:

    Качество/цена нормальные.

    Где лежит на полке в магазине знаю.

    И какое предложение вы мне можете сделать?

    Купить 2 упаковки стиральной порошка по цене одной?

    Хорошо, я и так его покупаю 2 по цене 2х. С точки зрения маркетинга хорошо, отчитались о росте продаж. Вот только мне надо 1 на месяц а не две. В результате следующая покупка будет через 2 месяца а не через 1

    Я так предполагаю что продавец/производитель бежит к маркетологу и говорит: «шеф все пропало, продажи упали …». А псу: а надо еще акцию маркетинговую провести …

    В итоге маркетологу хорошо, бюджет льется, мне тож нормально- покупаю в 2 раза дешевле.

    Вот только зачем это продавцу надо? Он теперь продет столько же только в 2 раза дешевле …

    Прогнило что-то в датском королевстве…


    1. AlekseyPraskovin
      29.04.2026 08:22

      Ну вы же сами все предельно ясно раскрыли: директор по маркетингу сначала собрал премию за внедрение новых персонализованных предложений, а потом получил бюджет на устранение падения продаж.

      Вот только зачем это продавцу надо?

      А "продавец", если вы про владельцев сети, давно уже за бизнесом не следит)