Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта.
В этой статье эксперты лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» рассматривают самые актуальные фреймворки для машинного обучения, анализируют причины их популярности, ключевые области применения и тенденции развития. Аналитика строится как на собственном опыте, так и на данных специализированных источников, таких как GeeksforGeeks, Upgrad, Octal Software и других, чтобы предоставить аргументированный и непредвзятый обзор.
Мы разделили обзор на две части. В первой рассматриваются фреймворки для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторая часть посвящена фреймворкам для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.
Фреймворки для глубокого обучения
PyTorch: фаворит исследователей
PyTorch разработан Meta AI. Её головная компания признана экстремистской организацией в России, но статус самого дочернего подразделения остаётся неясным. Официально PyTorch никто не запрещал. Он известен своим интуитивно понятным API и императивным стилем программирования. В PyTorch используются динамические графы вычислений, что упрощает прототипирование и отладку моделей, что особенно важно в исследованиях. Если в вашей компании есть подразделение R&D, наверняка оно уже использует PyTorch.
В 2025 году PyTorch занимает первое место по популярности в России (об этом подробнее ниже) и второе в США и ЕС [4]. Его динамический граф вычислений делает PyTorch любимцем исследователей, а поддержка облачных сервисов (например, Microsoft Azure) упрощает решение производственных задач [3]. Недавние улучшения PyTorch включают в себя расширенные возможности распределённого обучения и интеграцию с облачными платформами [3].
PyTorch активно используется в задачах глубокого обучения, таких как компьютерное зрение, обработка естественного языка (NLP) и различные исследования в области ИИ. Его гибкость делает PyTorch идеальным для экспериментов с новыми архитектурами нейронных сетей.
Гибкость PyTorch делает его основой для мощных библиотек, таких как PyTorch Lightning и Fastai, которые упрощают разработку моделей глубокого обучения. Эти фреймворки созданы для ускорения рабочих процессов, минимизации рутинного кода и повышения доступности глубокого обучения как для исследователей, так и для бизнеса.
PyTorch Lightning — это обёртка над PyTorch, которая структурирует код и автоматизирует рутинные задачи, сохраняя гибкость базового фреймворка. Она стандартизирует процесс обучения моделей, разделяя исследовательскую логику (архитектура модели) от инженерной (циклы обучения, логирование, распределённое обучение). Это особенно полезно для команд, где исследователи хотят сосредоточиться на экспериментах, а инженеры — на масштабировании и других технических задачах.
PyTorch Lightning идеально подходит для R&D-команд, разрабатывающих сложные модели, например, для компьютерного зрения или NLP, где важна скорость выполнения экспериментов и воспроизводимость результатов.
Fastai — это высокоуровневая библиотека, построенная поверх PyTorch, ориентированная на простоту и быстрый старт. Она предлагает готовые решения для стандартных задач глубокого обучения, таких как классификация изображений или обработка текстов, с минимальным количеством кода. Fastai идеально подходит для молодых специалистов и бизнеса, которые хотят быстро внедрить ИИ без глубокого погружения в детали.
«В нашей лаборатории большой популярностью пользуется фреймворк PyTorch. Мы применяем его для решения широкого спектра задач в области компьютерного зрения (CV), обработки аудиосигналов и естественного языка (NLP). PyTorch обеспечивает высокий уровень гибкости и интуитивно понятный интерфейс, что особенно важно на этапе прототипирования и проверки гипотез. Вместе с тем модели, обученные на PyTorch, достаточно легко конвертируются в форматы, которые мы используем при инференсе в продакшене. Для ускорения и стандартизации процесса обучения и сборки моделей часть команды использует PyTorch Lightning. Он позволяет упростить код, отделить логику модели от инфраструктурных аспектов (таких как логирование, сохранение чекпоинтов, работа с multi‑GPU и др.), а также легко интегрировать трекинг экспериментов с помощью сторонних сервисов. Благодаря этому время на подготовку эксперимента и его отладку сокращается, а воспроизводимость результатов повышается. Но вместе с тем некоторые коллеги отмечают потерю гибкости и контроля, поскольку Lightning прячет многое „под капотом“, что усложняет отладку нестандартных моделей и пайплайнов. Также мы не рекомендуем Lightning младшим коллегам, которые только начинают обучать модели. Высокий уровень абстракции затрудняет понимание того, что реально происходит в процессе обучения», — сказал руководитель лаборатории искусственного интеллекта компании «Криптонит» Виталий Пирожников.
TensorFlow: универсальный фреймворк
TensorFlow, разработанный командой Google Brain, остаётся одним из самых популярных и универсальных фреймворков для машинного обучения. Он поддерживает широкий спектр задач, включая глубокое обучение, и предлагает версии для мобильных устройств (TensorFlow Lite) и веб-приложений (TensorFlow.js). Поддержка GPU/TPU и статические графы вычислений обеспечивают высокую скорость и масштабируемость.
По данным GeeksforGeeks, TensorFlow лидирует по количеству упоминаний в научных публикациях и активности в сообществе GitHub [2]. В 2025 году TensorFlow продолжает доминировать благодаря поддержке Google, интеграции с облачными платформами (например, Google Cloud) и универсальности [3]. Новые оптимизации TensorFlow, выполненные в 2024 — 2025 годах, улучшают его производительность и скорость обучения, а расширенная поддержка оборудования (GPU и TPU) позволяет быстрее развёртывать модели [3].
TensorFlow идеально подходит для задач компьютерного зрения, распознавания речи и рекомендательных систем. Его экосистема включает TensorFlow Extended (TFX) для создания конвейеров ML.
Для корпоративных решений часто выбирают TensorFlow, в том числе и благодаря лёгкости его интеграции с облачными платформами. Также он востребован в производственных системах, в которых требуется масштабируемость и скорость.
Говоря о TensorFlow, стоит упомянуть и его «обёртку» Keras.
Изначально созданный Франсуа Шолле, с 2017 года Keras интегрирован в экосистему TensorFlow как высокоуровневый API. Сейчас он также поддерживает другие бэкенды, такие как PyTorch и JAX (о нём поговорим отдельно).
Как часть экосистемы TensorFlow, Keras наследует его мощь: поддержку GPU/TPU, распределённое обучение и интеграцию с TensorFlow Extended (TFX) для создания мощных конвейеров.
Keras предлагает лаконичный и понятный интерфейс, который позволяет создавать нейронные сети в несколько строк кода. Это снижает порог входа для новичков и ускоряет прототипирование. Он предоставляет готовые строительные блоки (слои, оптимизаторы, функции активации), которые легко комбинировать для создания сложных архитектур. Это делает Keras универсальным для задач от классификации изображений до обработки текстов.
В целом Keras ориентирован на простоту, гибкость и быстрый старт, что делает его разумным выбором для молодых специалистов и компаний, внедряющих ИИ в свои бизнес-процессы.
JAX: функциональный подход и глубокая оптимизация
JAX — это фреймворк для высокопроизводительных вычислений и машинного обучения, разработанный Google Research. Он сочетает гибкость Python с мощью аппаратного ускорения, предлагая уникальный подход к построению моделей глубокого обучения.
В частности, JAX использует XLA (Accelerated Linear Algebra), что обеспечивает оптимизацию вычислений на GPU и TPU. Это позволяет достичь высокой скорости обучения, сравнимой с TensorFlow, но с большей гибкостью.
Однако, в отличие от императивного стиля PyTorch, JAX использует чисто функциональное программирование, где модели описываются как неизменяемые функции.
В JAX используется библиотека autograd для автоматического вычисления градиентов, что делает его идеальным для задач оптимизации и глубокого обучения. Его функциональный стиль программирования упрощает работу с градиентами. Также JAX поддерживает JIT (Just-In-Time) компиляцию через jax.jit, что оптимизирует код для конкретного оборудования. Экосистема JAX включает библиотеки Flax и Haiku, которые упрощают создание нейронных сетей.
В целом JAX ориентирован на продвинутых исследователей и специалистов, работающих над передовыми задачами ИИ, а также на сложные задачи бизнеса, требующие высокой производительности.
Фреймворки для классического машинного обучения
scikit-learn: простота для ML
Разница между фреймворком и большой библиотекой довольно условна. Поэтому для полноты картины стоит упомянуть scikit-learn. Это библиотека Python для классического машинного обучения. Она поддерживает широкий спектр алгоритмов, включая регрессию, классификацию,кластеризацию, понижение размерности и препроцессинг. Её выбирают для быстрого прототипирования и других задач классического ML, где не требуется глубокое обучение.
Библиотека scikit-learn имеет хорошую совместимость с другими библиотеками Python, такими как NumPy, XNumPy и pandas. Её часто используют на первом этапе конвейера для предобработки данных.
Несмотря на растущее число конкурентных решений, scikit-learn остаётся лидером в задачах классического ML благодаря своей простоте и обширной документации [2][4]. Эту библиотеку особенно любят специалисты по анализу данных [5].
XGBoost: лидер в градиентном бустинге
XGBoost — это фреймворк для градиентного бустинга (постепенного повышения точности предсказаний деревьев решений), оптимизированный для максимальной производительности и лёгкой масштабируемости. Он особенно популярен в задачах прогнозирования и часто используется в соревнованиях по машинному обучению. Если вы участвовали в хакатонах по ML, то наверняка сталкивались с ним.
По данным Octal Software, XGBoost является одним из лучших инструментов для градиентного бустинга на структурированных данных [5]. Он остаётся популярным благодаря своей скорости, точности и простоте использования.
XGBoost идеален для задач классического машинного обучения, таких как классификация, регрессия и ранжирование. Он широко используется в финансовых моделях, системах рекомендаций и анализе данных.
Традиционно XGBoost выбирают для задач, где требуется высокая точность на структурированных данных.
CatBoost : дальнейшее развитие XGBoost
CatBoost — ещё один популярный фреймворк для градиентного бустинга, разработанный специалистами компании «Яндекс». Его можно рассматривать как эволюционное продолжение XGBoost. Оба фреймворка используют деревья решений и градиентный бустинг для построения моделей, но CatBoost вносит качественные улучшения.
В отличие от XGBoost, который требует ручного кодирования категориальных признаков, CatBoost автоматически обрабатывает их с помощью алгоритма ordered boosting. Это упрощает подготовку данных и снижает риск переобучения, обеспечивая более надёжные результаты на новых данных.
CatBoost завоевал популярность среди специалистов по машинному обучению (особенно российских) благодаря своей способности эффективно работать с категориальными данными. Он выполняет их автоматическое преобразование в числовые, что улучшает качество моделей и экономит время. Оптимизированный алгоритм и поддержка GPU позволяют CatBoost быстро обучать модели даже на больших наборах данных. Он хорошо подходит для задач классификации, регрессии и ранжирования.
Как XGBoost, так и CatBoost легко интегрируются с Python. Также они поддерживают интеграцию с pandas и scikit-learn. У обоих фреймворков есть подробная документация и развитое сообщество, что помогает быстрее их освоить.
LightGBM: градиентный бустинг на гистограммах
LightGBM — это высокопроизводительный фреймворк для градиентного бустинга, разработанный Microsoft. Он использует алгоритм Histogram-based Gradient Boosting, который группирует данные в гистограммы, значительно снижая объём памяти и ускоряя обучение.
Это особенно важно для работы с большими данными. Фреймворк оптимизирован для обработки миллионов строк и тысяч признаков, что актуально для многих бизнес-приложений из сферы BigData, таких как прогнозирование спроса, многофакторная оценка рисков и глубокий анализ клиентских данных.
LightGBM строит деревья по принципу leaf-wise (разделение листьев с максимальным снижением функции потерь), в отличие от level-wise подхода XGBoost и CatBoost. Это позволяет создавать более глубокие и сложные деревья. Такой подход повышает точность предсказаний, но требует более тщательной настройки для предотвращения переобучения.
В отличие от XGBoost, у которого категориальные признаки требуют предварительного кодирования, LightGBM поддерживает их напрямую, разбивая категории на основе гистограмм. Однако, по сравнению с CatBoost, LightGBM применяет более простое разбиение, что менее эффективно с наборами данных, имеющих большое количество категорий.
Дополнительно LightGBM использует технику Gradient-based One-Side Sampling (GOSS), которая отбирает данные с большими градиентами для обучения, игнорируя менее информативные. Это отличает его от XGBoost, который обрабатывает все данные. GOSS ускоряет обучение ценой незначительной потери точности.
Часто LightGBM применяется в рекомендательных системах, кредитном скоринге и маркетинге. Его способность работать с категориальными признаками без предварительного кодирования упрощает подготовку данных и экономит время.
Прогнозы и тенденции
Среди ключевых трендов развития фреймворков машинного обучения можно выделить следующие:
Доминирование TensorFlow и PyTorch
Анализ HashDork за 2025 год подтверждает доминирование TensorFlow и PyTorch среди фреймворков глубокого обучения. TensorFlow выделяется своей масштабируемостью и всесторонними инструментами для производственных сред, тогда как PyTorch ценится за гибкость и динамические вычислительные графы в исследовательских задачах.
TensorFlow продолжит лидировать благодаря поддержке Google, интеграции с облачными платформами и универсальности. PyTorch укрепит позиции в исследованиях благодаря гибкости и удобству.
Облачные платформы как фактор выбора
Облачные платформы (Azure, AWS, Google Cloud и другие) будут продолжать поддерживать TensorFlow, PyTorch и scikit-learn, делая их основными инструментами для корпоративных решений.
Снижение популярности менее гибких инструментов
Фреймворки, ориентированные на экосистемы отдельных разработчиков (такие как СТЕЛ и MXNet), снизят популярность из-за менее активного сообщества и ограниченной поддержки, оставаясь в узкоспециализированных нишах.
Рост AutoML и MLOps
Инструменты автоматизации машинного обучения (AutoML) и операционализации ML (MLOps) станут ещё более важными для бизнеса. Продолжат набирать популярность облачные платформы для машинного обучения (такие как H2O.ai и Amazon SageMaker). Однако в России их применение может быть ограничено из-за санкционного давления и запрета размещения некоторых данных на зарубежных серверах.
Согласно обзору Unite.AI за 2025 год, облачные платформы машинного обучения, такие как Azure Machine Learning, Google Cloud Vertex AI и Amazon SageMaker, находятся в авангарде, обеспечивая надёжную поддержку популярных фреймворков [6]. Эта интеграция позволяет упростить развёртывание и масштабирование моделей машинного обучения, удовлетворяя потребности как исследований, так и производственных задач.
Интеграция с квантовыми вычислениями
С развитием квантовых компьютеров ожидается рост интеграции ML с квантовыми вычислениями. Фреймворки, такие как TensorFlow Quantum, могут стать ключевыми инструментами в этой области.
Популярность фреймворков в России
Мы также провели исследование популярности фреймворков в вакансиях ML/DL-специалистов на платформе Head Hunter [7]. Поиск производился по упоминанию фреймворка в описании к вакансии. Рассматривались вакансии в РФ.

Российская специфика в том, что наши специалисты по ML/DL почти не используют зарубежные облачные сервисы, с которыми тесно интегрированы популярные в США и ЕС фреймворки [4]. Поэтому в тройку лидеров по России вошли фреймворки с открытым исходным кодом, из которых можно выжать максимум на своей инфраструктуре (on premise).
«На мой взгляд, TensorFlow среди российских специалистов постепенно теряет свою популярность. Сегодня его применение чаще связано с поддержкой legacy-проектов, чем с разработкой новых решений. Дополнительным подтверждением этого тренда служит тот факт, что в университетских курсах, связанных с ИИ, все чаще обучают именно работе с PyTorch. Гибкость, простота и сильное сообщество становятся сегодня ключевыми факторами выбора – особенно для тех, кто вскоре будет задавать тон в индустрии», — пояснила старший специалист-исследователь лаборатории искусственного интеллекта компании «Криптонит» Анна Холькина.
Таблица сравнения фреймворков
Фреймворк |
Основные задачи |
Преимущества |
Недостатки |
PyTorch |
Исследования, глубокое обучение, компьютерное зрение, обработка естественного языка |
Гибкость, удобство отладки, динамический граф, обёртки PyTorch Lightning и fastai |
Меньше инструментов для развёртывания в продакшене, мониторинга и визуализации экспериментов |
TensorFlow |
глубокое обучение, компьютерное зрение, обработка естественного языка |
Масштабируемость, готовые модели, поддержка Google, облачная интеграция, обёртка Keras
|
Сложен в освоении, статический граф |
JAX |
Генеративный ИИ, физическое моделирование, HPC, обучение нейронных сетей |
функциональное программирование, глубокая оптимизация на TPU |
Сложен в освоении, мало готовых решений |
XGBoost |
Классическое ML, градиентный бустинг, прогнозирование |
Высокая точность, скорость, простота использования |
Ограничен структурированными данными |
LightGBM |
BigData, градиентный бустинг |
Прямая поддержка категориальных признаков |
Упрощённая разбивка категорий |
scikit-learn |
Классическое ML, анализ данных |
Простота, обширная документация и большой набор алгоритмов, интеграция с Python |
Нет поддержки глубокого обучения. Больше ограничений для BigData |
Выводы
Выбор фреймворка для машинного обучения как и прежде зависит от конкретных потребностей проекта. При этом представителям бизнеса и ИТ-специалистам важно учитывать не только текущую популярность фреймворков, но и их потенциал для интеграции с будущими технологиями.
Для задач глубокого обучения TensorFlow и PyTorch являются наиболее предпочтительными вариантами. При этом TensorFlow идеален для производственных систем, а PyTorch — для исследований.
В случае классического машинного обучения scikit-learn остаётся лучшим выбором. XGBoost/CatBoost и LightGBM отлично подходят для градиентного бустинга.
Мы ожидаем не только дальнейшего развития этих фреймворков, но и появления новых инструментов, интегрированных с квантовыми вычислениями и отечественными облачными платформами.
Yozh-lyudoyed
Вот интересно, запись в таблице:
Она зачем? А к остальным фреймворкам это не относится?
I-AV
Обучение нейронных сетей выделено как одна из сильных сторон JAX. Он позволяет вычислять градиенты для произвольных функций с высокой точностью и эффективностью. Это особенно важно для нестандартных архитектур нейронных сетей. В отличие от PyTorch или TensorFlow, JAX использует функциональный подход. В нём данные неизменяемы, а операции выражаются через чистые функции. Это снижает вероятность ошибок, которые иногда возникают в PyTorch при работе с динамическими графами, упрощает отладку и делает код более предсказуемым. Также JAX поддерживает библиотеки Flax и Haiku, которые упрощают построение и обучение нейросетей. За счёт них в экосистеме JAX можно создавать сложные модели, сохраняя при этом контроль над низкоуровневыми операциями, чего иногда не хватает в более высокоуровневых фреймворках.