Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с "идеальным сценарием". За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Проблема планирования ремонтов в масштабах страны
Представьте парк из десятков тысяч грузовых вагонов, разбросанных по территории от Калининграда до Владивостока. Каждый вагон имеет свой межремонтный пробег, после которого требует обязательного планового обслуживания. Ежедневно сотни вагонов выбывают из эксплуатации и требуют решения: на какое из 150+ ремонтных предприятий их направить?
Сложность задачи многомерна. Нужно прогнозировать, когда именно каждый вагон потребует ремонта. Разница в стоимости ремонта между предприятиями достигает 35%, а транспортировка до места ремонта варьируется от 5 до 50 тысяч рублей. У каждого ВРП (вагоноремонтного предприятия) свои ограниченные квоты и специализация. И каждый день ожидания означает потери до 3000 рублей на вагон.
Традиционный подход реактивен: вагон выбыл, диспетчер ищет варианты, принимает решение на основе опыта и доступной информации. Проблема в том, что изолированные решения не учитывают системную оптимизацию. Современный подход — предиктивный ремонт с оптимальной маршрутизацией — требует создания комплексной системы, которая прогнозирует выбытие вагонов заранее, рассчитывает оптимальное распределение по ВРП и поддерживает операционные решения в реальном времени.
Мировые практики: анализ ключевых решений
Европейские лидеры: от IoT к цифровым двойникам
Компания Ermewa, управляющая парком в 50,000 вагонов, с 2018 года развивает платформу Maintenance 4.0. Проект получил значительные внутренние инвестиции Ermewa Group и поддержку европейских грантовых программ. Их технологический стек включает IoT-сенсоры для мониторинга вибрации и температурных режимов, edge computing для обработки данных непосредственно на вагоне и самообучающиеся AI-алгоритмы диагностики. Результат — снижение времени простоя на 10-15% и повышение общей эксплуатационной готовности парка.
Параллельно развивается Railnova, которая с 2020 года привлекает венчурное финансирование для развития телематических решений. Их облачная платформа с AI-модулями обеспечивает снижение внеплановых ремонтов на 15-20% и улучшение планирования на 25-30%. Главная проблема — сложность интеграции с устаревшим подвижным составом и высокие первоначальные инвестиции.
Особого внимания заслуживает общеевропейский проект AUTOSUP в рамках Horizon 2020. С бюджетом в несколько миллионов евро проект создает единую цифровую экосистему для автоматизации техобслуживания в транспортных узлах. Использование цифровых двойников для моделирования состояния вагонов уже показало сокращение простоев на 20-25% в пилотных проектах.
Великобритания пошла своим путем. Государственный проект RSSB Wheelset Intervention Support Tool, запущенный в ноябре 2024 года после двух лет разработки, фокусируется на безопасности. AI-алгоритмы анализируют данные с детекторов нагрузки на колеса, предотвращая около 100 потенциальных аварийных ситуаций в год. Узкая специализация на критически важном компоненте — колесных парах — позволила достичь высокой эффективности без попыток решить все проблемы сразу.
Стартап Everysens развивает с 2022 года комплексную платформу Fleet Efficiency. Их Transport Visibility Management System с AI-ассистентом RALF обещает сокращение отмены поездов на 50% и снижение транспортных расходов на 30%. Венчурные инвестиции в несколько миллионов евро позволяют им экспериментировать с передовыми технологиями, но пока речь идет больше о потенциале, чем о доказанных результатах.
Российский контекст: уникальные вызовы
Анализируя международный опыт и сопоставляя с российскими реалиями, мы обнаружили фундаментальные различия, делающие прямое копирование западных решений невозможным.
Среднее расстояние до ВРП в России составляет 500-2000 километров против 200-400 в Европе. Это кардинально меняет экономику транспортировки. При этом парк компании в примерно 100,000 [МИМ1] вагонов превосходит Ermewa с их50,000, а установка IoT-сенсоров на такой объем потребовала бы инвестиций, сопоставимых с годовой выручкой компании.
Инфраструктурные ограничения добавляют сложности. У нас 150+ ВРП с уровнем оснащения от современных комплексов до предприятий советской постройки. Обязательная интеграция с информационными системами РЖД для управления перевозками, отсутствие единых стандартов обмена данными, legacy-системы, работающие с 1990-х годов — все это создает уникальный технологический ландшафт. Разброс цен на ремонт до 35% против европейских 15-20% (оценочно) создает больший потенциал для оптимизации, но и большую сложность в принятии решений.

Наш подход: расчет эффекта до начала разработки
Вместо копирования западных подходов мы решили разработать собственную систему. В первую очередь оценили потенциал проекта через математическое моделирование. Идея проста: сравнить, как распределялись вагоны на ремонт фактически, и как бы они распределялись в идеальном мире с полной информацией и оптимальными решениями.
Начали со сбора исторических данных за репрезентативные периоды — зиму, весну, лето и осень. Для каждого ремонта фиксировали место образования потребности, выбранное ВРП и альтернативы, полную стоимость включая транспортировку и простой, временные параметры. Это дало нам базовую линию — как работает система сейчас.
Затем разработали математическую модель на основе классической задачи маршрутизации транспорта (VRP), но адаптированную под железнодорожную специфику. Варианты распределения вагонов анализируются одновременно с учетом всех ограничений: квот по приему на ВРП, специализации предприятий, договорных обязательств.
Критически важным этапом стал gap-анализ совместно с бизнесом. Мы провели несколько встреч с операционными и экономическими подразделениями и классифицировали выявленный потенциал. Оказалось, что реализовать можно 60-70% от теоретического максимума — это выбор более выгодных ВРП при наличии квот, оптимизация маршрутов транспортировки, сокращение простоев через планирование. Остальные 30-40% нереализуемы из-за технологических ограничений конкретных ВРП, долгосрочных контрактов или форс-мажорных обстоятельств.
Пилотная валидация на контрольной группе из нескольких сотен вагонов подтвердила наши расчеты с погрешностью менее 15%. Это дало зеленый свет разработке.
Ключевая метрика успеха
Мы долго искали единую метрику, которая была бы понятна всем — от разработчиков до топ-менеджмента. Ей стал процент вагонов, направленных в топ-5 оптимальных ВРП согласно модели. Простая, измеримая, напрямую связанная с экономическим эффектом. Эта метрика стала универсальным языком между IT, бизнесом и операциями.

Техническая реализация: оптимизация без IoT
Наша система(«Цифровой вагон») состоит из трех взаимосвязанных компонентов, каждый из которых решает свою задачу в общей цепочке оптимизации.
Модуль прогнозирования выбытия вагонов в плановый ремонт [SP2] использует статистические методы вместо IoT-сенсоров. Анализируя исторические данные о ремонтах, регламентные требования эксплуатации и маршрутные данные по вагонам, он достигает высокой точности, достаточной для работы на продуктиве на месячном горизонте — сопоставимо с дорогостоящими IoT-системами, но без капитальных затрат.
Оптимизатор месячного распределения («План ремонта») работает с масштабом, превосходящим западные аналоги. Пятьсот тысяч переменных, время решения до 1 часа для месячного плана, одновременный учет 150+ ВРП — это вычислительный вызов, который мы успешно решили.
Система поддержки операционных решений («Матрица заадресации») выдает диспетчеру топ-5 рекомендаций с обоснованием каждой. Но ключевая особенность инструмента— развитый механизм обратной связи, который превратил систему из калькулятора в постоянно обучающийся организм.
Построение эффективного сбора обратной связи
Когда диспетчер отклоняется от рекомендации системы, он обязан указать причину через простой интерфейс. Каждую неделю формируются автоматические отчеты по отклонениям, выявляющие систематические проблемы. Если определенное ВРП постоянно недоступно из-за исчерпанных квот, система закладывает более консервативную оценку его мощности.
Встречи с диспетчерами дают качественную обратную связь. Именно на таких встречах выявляются неочевидные бизнес-правила, которые никто не формализовал, но все знают. А новые версии алгоритма сначала тестируются на контрольной группе через A/B тестирование и только после подтверждения улучшений раскатываются на весь парк.
Проблемы внедрения: честно о сложностях
У любого аналитика данных есть два главных врага. Первый — это данные, и они оказались именно такими, как мы опасались. Грязными, с вагонами, "отремонтированными" в несуществующих депо, и ремонтами с отрицательной стоимостью. Неполными — часть записей не содержали критически важной информации о транспортных затратах. Противоречивыми — один и тот же ремонт фигурировал в разных системах с разными параметрами, одно и тоже предприятие имело пару десятков названий в разных системах.
Пришлось создать отдельный процесс очистки и валидации данных, внедрить правила контроля качества на входе, долго и терпеливо договариваться с источниками данных о постепенном улучшении качества. Это заняло 40% времени проекта — больше, чем собственно разработка алгоритмов.
Второй враг — реальность, которая всегда сложнее любой модели. Некоторые оптимальные с точки зрения математики решения оказались нереализуемы просто потому, что часть информации невозможно получить каким-либо путем, кроме email или звонка на телефон оператору. Пандемия, санкции, изменения в логистических цепочках требовали постоянной адаптации модели. "Бросание" вагонов, когда рекомендацию по ремонту невозможно выполнить из-за ограничений на пропускную способность дороги, сезонные ограничения на некоторых участках, человеческий фактор при принятии финальных решений — все это пришлось учитывать.
Организационные вызовы оказались не менее сложными. Диспетчеры с двадцатилетним опытом не горели желанием следовать рекомендациям "какого-то алгоритма". [МИМ4] Мы провели обучающие сессии, показали, что система — помощник, а не замена. Внедрение прошло постепенно, начиная с информационного режима, когда рекомендации показывались, но не были обязательными.
Уроки и ключевые выводы
Что может взять индустрия
Наш опыт показывает, что можно достигать результатов, сопоставимых с дорогостоящими IoT-решениями, через грамотное использование математики для описания существующих процессов. В то время как Railnova и Ermewa требуют венчурного финансирования и пяти-семи лет на окупаемость, мы вышли на положительный эффект менее чем за полгода.
Методология работы в условиях ограничений оказалась универсальной. Математическая оптимизация и статистические расчеты вместо сенсоризации, итерационное улучшение вместо революционной замены — эти принципы применимы далеко за пределами железнодорожной отрасли.
Построение эффективного сбора обратной связи критически важно для любой аналитической системы. Простая система сбора обратной связи, регулярный цикл анализа и улучшений, вовлечение пользователей в развитие системы — без этого даже самый совершенный алгоритм останется мертвым кодом.
Ключевые уроки
Понятный экономический эффект оказался основой долголетия проекта. Система живет уже два с половиной года и используется при заадресовке вагонов по всей стране именно потому, что с первого дня мы смогли показать конкретную экономию в рублях, а не абстрактное "повышение эффективности".
Включение KPI проекта в KPI бизнеса дало мощный толчок. Когда наша метрика стала частью операционных показателей департамента, успех проекта стал успехом всех участников. Это изменило отношение от "нам навязали систему" к "наша система помогает нам работать лучше".
Сильная команда действительно важнее технологий. У нас собрались люди, понимающие железную дорогу изнутри, владеющие современными технологиями и умеющие говорить на языке бизнеса. Эта комбинация оказалась важнее выбора конкретных алгоритмов или технологического стека.
Выводы и перспективы
Наш опыт доказывает: не нужно копировать западные IoT-решения или ждать идеальных условий. Пока Ermewa, Railnova и AUTOSUP инвестируют миллионы в сенсоры и ждут годы окупаемости, мы достигли сопоставимых результатов через математическую оптимизацию существующих процессов.
При парке в около 100,000 вагонов — больше, чем у европейского лидера Ermewa — мы обеспечиваем эффективность на уровне лучших мировых практик, но без их капитальных затрат. Система стала неотъемлемой частью операционных процессов ПГК.
Ключ к успеху — не в слепом копировании, а в адаптации под локальную специфику, фокусе на экономическом эффекте с первого дня, построении системы постоянного улучшения через обратную связь и готовности работать с реальными, несовершенными данными в сложном, меняющемся мире.
Работаете над похожими задачами?
Интересно обсудить, как достигать результатов IoT-решений без масштабных инвестиций, что эффективнее в вашей индустрии — математическая оптимизация или IoT, как строить data-driven культуру в традиционных компаниях и какой у вас опыт работы с парками в десятки тысяч единиц техники.
Делитесь опытом в комментариях или пишите в личку — всегда рад обменяться опытом с коллегами, решающими похожие задачи!