В гонке за лидерство в области искусственного интеллекта важны не только мощные чипы, но и то, как они связаны между собой. Huawei анонсировала SuperPoD Interconnect — собственную технологию межсоединений, призванную конкурировать с NVLink от NVIDIA. Если говорить по-простому, это с нуля разработанный аналог знаменитого NVLink от NVIDIA, тот самый «клей», который соединяет тысячи ИИ-ускорителей Ascend в один гигантский супермозг.

Для Huawei SuperPoD Interconnect — шаг к созданию собственной экосистемы в области искусственного интеллекта. Когда доступ к передовым чипам NVIDIA закрыт, единственный путь вперед — развивать свои решения и технологии межсоединений. Это позволяет не только продолжать работу в условиях санкций, но и претендовать на более независимую роль в мировой ИТ-инфраструктуре. Сегодня обсудим новинку и ее перспективы.

Нервная система для армии чипов: что под капотом у SuperPoD

Так что же такое этот SuperPoD и почему вокруг него столько шума? Представьте себе процесс обучения какой-нибудь версии GPT. Эта модель настолько огромна, что ее приходится «нарезать» на куски и распределять по тысячам чипов. В результате этого процесса каждый из тысяч чипов постоянно должен обмениваться с соседями гигантскими объемами информации — градиентами, весами, активациями. Если связь между ними оказывается медленной, ускорители будут тратить больше времени на ожидание данных, чем на вычисления.

Кадр с презентации Huawei. Источник
Кадр с презентации Huawei. Источник

В основе SuperPoD лежит архитектура, которую Huawei называет UB-based network. Это вариант полносвязной топологии, близкий к решениям Fat Tree или Dragonfly, специально созданным для суперкомпьютеров. Главная идея — чтобы каждый ускоритель мог напрямую обмениваться данными с любым другим с минимальной задержкой. Для этого внутри стоек применяются электрические соединения, а для межстойковых связей — оптика.

На словах схема кажется простой, но на практике она упирается в целый набор инженерных задач: нужны высокоточные оптические коннекторы, стабильные линии на платах с плотнейшей разводкой и механизмы быстрой защиты от сбоев. Huawei подчеркивает, что SuperPoD должен выдерживать отказ отдельных компонентов без заметного влияния на работу всего кластера. Именно сочетание аппаратной архитектуры и механизмов отказоустойчивости позволяет масштабировать систему без потери производительности.

Чтобы оценить объем замысла, достаточно взглянуть на флагманский продукт, где эта технология уже работает, — Atlas 950 SuperCluster. Его стартовая конфигурация объединяет 8 192 чипа Ascend, но архитектура, по словам Huawei, готова к масштабированию до систем, насчитывающих более 500 тысяч ускорителей. Это уже инструмент не просто для бизнеса, а для фундаментальной науки. Но само «железо» — это лишь половина дела. Настоящая магия происходит на уровне программного обеспечения. Специальный планировщик задач и коммуникационные библиотеки (аналог знаменитой NVIDIA NCCL) должны понимать эту сложную топологию и распределять потоки данных так, чтобы избежать любых столкновений. Именно от качества этого софта зависит, превратится кластер в слаженный оркестр или останется шумной толпой.

Что ждет Huawei в битве за ИИ-рынок

SuperPoD — это часть более широкой стратегии Huawei, которая делает ставку на полный контроль над собственным технологическим стеком. Компания стремится замкнуть все ключевые элементы у себя: от проектирования чипов и систем межсоединений до программных библиотек и облачных сервисов. В дорожной карте уже обозначен Atlas 960 — система, запланированная к выпуску в 2027 году, которая должна объединять свыше миллиона ускорителей.

Вертикальная интеграция напрямую связана с особенностями архитектуры процессоров Ascend. В отличие от универсальных GPU, которые создавались как гибкие вычислители для разных задач, Ascend изначально разрабатывались именно под сценарии ИИ и оптимизированы для матричных операций. Это дает Huawei возможность выстраивать связку «чип — интерконнект — программное обеспечение» более плотно и согласованно. Такой подход позволяет снизить издержки на уровне совместимости, лучше управлять энергопотреблением и повышать эффективность кластеров за счет оптимизации всего пути данных, а не только отдельных компонентов.

Если сравнивать подходы, то NVIDIA и Huawei ведут бой в совершенно разных стилях. NVIDIA делает ставку на максимальную производительность каждого отдельного ускорителя. H100 в связке с NVLink 4.0 обеспечивает теоретическую пиковую пропускную способность до 900 ГБ/с на чип. Huawei же выстраивает противоположную модель: ее подход основан не столько на мощности отдельного процессора, сколько на эффективности взаимодействия тысяч ускорителей в единой системе. В этой стратегии ценность определяется не силой одного элемента, а слаженностью всей архитектуры.

Huawei утверждает, что Atlas 950 демонстрирует производительность в 6,7 раза выше системы Nvidia NVL144. При этом стоит учитывать, что речь идет о внутренних данных компании, а сама конфигурация NVL144 официально не представлена на рынке. Поэтому это скорее ориентир для понимания масштаба амбиций Huawei, чем результат независимого тестирования.

Если аппаратная часть окажется конкурентоспособной, перед Huawei остается куда более серьезная задача — программная экосистема. Здесь лидер — CUDA, она фактически стала стандартом для ИИ и машинного обучения. Под нее оптимизированы все ключевые фреймворки, она лежит в основе университетских курсов и окружена сообществом разработчиков по всему миру. Альтернативы вроде ROCm от AMD или OneAPI от Intel существуют, но именно CUDA создала эффект «сетевой ловушки», выйти из которой крайне сложно.

Но даже если Huawei решит проблему софта, остаются и другие риски. Смогут ли китайские фабрики, в первую очередь SMIC, обеспечить массовое производство столь сложных чипов на конкурентоспособном техпроцессе без доступа к передовым EUV-литографам? Какова будет реальная надежность и энергоэффективность систем из сотен тысяч компонентов? Управление таким монструозным кластером — это логистический и операционный кошмар.

Что дальше?

Несмотря на сложности, у Huawei остаются возможности для роста. Санкции фактически разделили рынок на отдельные зоны, где американские технологии недоступны, и именно в этих регионах возникает потребность в альтернативных поставщиках. Это касается не только оборудования для дата-центров, но и целых экосистем: от специализированных процессоров и систем межсоединений до библиотек и сервисов, которые позволяют разворачивать ИИ-инфраструктуру «под ключ».

Huawei старается занять эту нишу, делая ставку на страны Азии, Ближнего Востока и Латинской Америки, где интерес к развитию собственных цифровых экосистем растет. Для этих рынков компания предлагает не отдельные продукты, а комплексные решения, которые можно внедрять без оглядки на санкционные ограничения. Такая стратегия позволяет укреплять позиции не только в технологическом плане, но и в политико-экономическом контексте, формируя альтернативный лагерь стандартов и решений.

Путь предстоит долгий и непростой: требуется масштабное производство, развитие программной среды и проверка надежности в реальных проектах. Однако первый шаг уже сделан — Huawei создала базовую архитектуру, которая может стать фундаментом для будущих ИИ-систем в тех регионах, где доступ к американским разработкам ограничен или закрыт.

Комментарии (1)


  1. rPman
    30.09.2025 16:32

    Когда речь идет о аппаратных решениях, нельзя забывать и о программной поддержке. У nvidia это огромное историческое наследие, достаточно открытые технологии (особенно в свете ИИ)... а что у huawei? Да и просто железо на сколько доступно? можно взять 700$ и купить что-нибудь на посмотреть на практике? или как обычно цены по запросу, и если ты не компания с семизначными цифрами, то идите лесом?