NVIDIA представила DGX Cloud Lepton — платформу, объединяющую вычислительные мощности GPU от различных облачных провайдеров по всему миру. Цель проекта — упростить доступ разработчиков и предприятий к GPU для обучения и развертывания ИИ-моделей.

Что такое DGX Cloud Lepton?

DGX Cloud Lepton — это облачная платформа, которая служит агрегатором вычислительных мощностей от множества провайдеров, включая CoreWeave, Crusoe, Firmus, Foxconn, GMI Cloud, Lambda, Nebius, Nscale, SoftBank Corp. и Yotta Data Services. Платформа позволяет пользователям выбирать поставщиков GPU по регионам, типам чипов и срокам аренды. Такой подход обеспечивает гибкость и соответствие требованиям государственного регулирования в сфере ИТ.

Платформа интегрируется с программным стеком NVIDIA, включая NIM, NeMo, Blueprints и Cloud Functions.

В чем преимущества для разработчиков:

  • быстрый старт без капитальных затрат. Можно быстро получить доступ к GPU последних поколений, от H100 до Blackwell, без закупки оборудования и долгих тендеров;

  • единая точка входа. Через интерфейс DGX Cloud Lepton можно управлять ресурсами от разных провайдеров как через один API, без необходимости интеграции с каждым поставщиком отдельно;

  • точечное масштабирование. В случае кратковременных пиковых нагрузок (например, в ходе тонкой настройки LLM или stress-тестов) можно арендовать вычислительные ресурсы на несколько часов или дней;

  • приоритетная аренда мощностей в конкретном регионе. Это помогает соответствовать требованиям к локализации обработки персональных данных и минимизировать задержки при работе с edge-сервисами;

  • интеграция с экосистемой NVIDIA. Разработчики могут безболезненно переносить пайплайны из одной среды в другую (локальную, облачную или гибридную). Для этого можно использовать единый набор инструментов, включая NeMo для LLM, Triton Inference Server и NGC-контейнеры.

Пример: если стартап из Европы хочет протестировать несколько fine-tuning-стратегий на LLaMA 3 70B, он может мгновенно арендовать десятки A100/Blackwell GPU в регионе ЕС без необходимости выстраивать собственную ИТ-инфраструктуру. А для крупных интеграторов платформа снижает барьер выхода на новые рынки. Иначе говоря, нет нужды договариваться с дата-центрами в каждом регионе. Все происходит централизовано через платформу Lepton.

Стратегия NVIDIA: расширение экосистемы и поддержка малых провайдеров

Запуск DGX Cloud Lepton отражает стратегический подход NVIDIA к расширению своей экосистемы и поддержке малых и средних облачных провайдеров. Платформа предоставляет им возможность предложить свои ресурсы широкой аудитории разработчиков, что способствует развитию ИТ-рынка.

Аналитики отмечают, что этот шаг помогает NVIDIA укрепить прямые связи с разработчиками и предприятиями, расширяя свое присутствие в облачной инфраструктуре и снижая зависимость от гиперскейлеров вроде AWS, Google Cloud и Microsoft Azure. Вместо того чтобы ориентироваться только на инфраструктуру гигантов, NVIDIA теперь выстраивает собственную децентрализованную "ИИ-фабрику" глобального масштаба.

Что это может означать для индустрии в целом?

Ранее локальные или нишевые облачные провайдеры вроде Lambda или Yotta имели ограниченное проникновение. Их ресурсы были доступны только напрямую или через ограниченные каналы. С Lepton они получают доступ к глобальной торговой площадке от NVIDIA.

В условиях дефицита GPU малые провайдеры часто работают с неполной загрузкой. Особенно если у них нет активных корпоративных клиентов. Lepton позволяет монетизировать простаивающие ресурсы, сдавая их в аренду через API NVIDIA.

Кроме того, переход от Hopper к Blackwell, а в перспективе к Rubin, затратный и технически сложный. Lepton помогает нивелировать риски, так как провайдеры могут сдавать в аренду даже старые поколения GPU, пока закупают новые.

Вместо затрат на маркетинг, продажи и поддержку малые провайдеры могут сконцентрироваться на инфраструктуре, тогда как клиентский поток приходит через платформу NVIDIA. Это особенно важно для стартапов в Азии, Восточной Европе или Латинской Америке.

В условиях, когда крупные игроки арендуют сотни тысяч GPU напрямую у NVIDIA, малым игрокам все труднее конкурировать. Lepton создает более равномерный рынок, где ресурсы становятся сопоставимыми по доступности.

Как отметил аналитик Gartner Чираг Декате (Chirag Dekate):

GPU-провайдеры как сервис испытывают трудности при каждом переходе на новое поколение. DGX Cloud Lepton помогает пользователям абстрагироваться от сложности построения кластера, предлагая простой доступ к GPU через единую точку входа.”

Пример: компания в Индии, запустившая облако на A100, не может конкурировать напрямую с AWS. Однако за счет участия в экосистеме Lepton, компания получает доступ к западным клиентам, заинтересованным в краткосрочной аренде дешевых GPU в азиатском регионе.

Влияние на рынок и вызовы

Хотя NVIDIA продолжает доминировать на рынке GPU, текущий спрос значительно превышает предложение. Малые и средние облачные провайдеры сталкиваются с трудностями в обеспечении необходимой мощности и поддержке новых поколений чипов, таких как Blackwell и Rubin.

Платформа DGX Cloud Lepton помогает решить эти проблемы, предоставляя разработчикам доступ к широкому спектру GPU и упрощая процесс их использования.

Это особенно важно для тех, кто не имеет возможности самостоятельно развертывать и поддерживать инфраструктуру.

Заключение

Выход в свет платформы DGX Cloud Lepton от NVIDIA представляет собой важный шаг в развитии облачных вычислений и ИИ-инфраструктуры. 

Решение предоставляет разработчикам и предприятиям доступ к мощным GPU, упрощая процесс их использования и способствуя развитию ИТ-рынка. 

Однако в условиях санкционного давления на российские компании, хранение данных за рубежом сопряжено с рисками вплоть до блокировки доступа и утраты данных.

ITGLOBAL.COM предлагает надёжную альтернативу для задач, требующих высокой вычислительной мощности:

Получить консультацию по GPU-инфраструктуре от специалистов ITGLOBAL.COM можно, оставив заявку на нашем сайте.

Комментарии (0)