Разделы

Бизнес Импортонезависимость Техника

Андрей Чернышев, Delta Computers: Мы сделали первую российскую аппаратную платформу для искусственного интеллекта

Графические адаптеры Nvidia рассматриваются как критически важный инструмент для развития приложений искусственного интеллекта (ИИ) ввиду сильной зависимости нейросетей от GPU-ускорителей. Какими характеристиками обладают и для каких приложений предназначены отечественные GPGPU платформы Delta Sprut для подключения GPU-ускорителей компаний Nvidia, AMD и других, в интервью CNews рассказал Андрей Чернышев, генеральный директор компании Delta Computers.

Рынок требует больше вычислительных мощностей на GPU-адаптерах

CNews: Давайте начнем с ситуации на рынке графических акселераторов, какова она?

Андрей Чернышев: Здесь можно ответить одной фразой — взрывной рост спроса на high-end GPU-адаптеры продолжается. Примерно пару лет назад утих спрос, связанный с майнингом криптовалют на GPU, но тут очень вовремя подоспел бум приложений искусственного интеллекта (ИИ). Образно говоря, разработчики приложений сегодня стараются прикрутить ИИ ко всему, до чего руки дотянутся, что стимулирует спрос на вычислительные ресурсы.

Андрей Чернышев, Delta Computers: Взрывной рост спроса на high-end GPU-адаптеры продолжается

Ведущие игроки рынка, Microsoft, OpenAI, Amazon, Meta* и Google заключили в 2023–2024 годах с компанией Nvidia сделки на массовую закупку ее решений, чтобы продолжать развивать функции искусственного интеллекта и обеспечить выпуск своих новых продуктов. Хотя очевидно, что крупнейшие ИТ-компании мира попытаются поколебать монополию Nvidia в сфере искусственного интеллекта. Недавно Intel, Google, Arm, Qualcomm, Samsung и др. объединились вокруг нового Фонда объединенного ускорения (UXL), который сфокусируется на создании открытой программной платформы и даст разработчикам больше свободы.

Дженсен Хуанг, основатель и генеральный директор Nvidia, заявил в пресс-релизе в феврале 2024 года: «Ускоренные вычисления и генеративный искусственный интеллект достигли переломного момента. Спрос на продукцию Nvidia растет во всем мире среди компаний, отраслей и стран».

В 2024 году Nvidia планирует выпустить новый чип Blackwell B200, являющийся вершиной линейки продуктов, что подогревает ожидания рынка относительно взрывного роста производительности GPU-адаптеров, основанных на этом новом процессоре.

Кроме интереса рынка к самым мощным моделям GPU-адаптеров, существует спрос на модули расширения PCIe (PCI Express) для параллельного использования (агрегирования) графических адаптеров, в т.ч. с процессорами Nvidia или AMD. Такие модули расширения позволяют оперативно конфигурировать серверы в облачных дата-центрах и в серверных комнатах на предприятиях (on-premises) под определенные высокопроизводительные вычислительные задачи, управляя парком имеющихся GPU-адаптеров и вычислительных юнитов. Они представляют собой важный инструмент для создания высокопроизводительных систем, способных эффективно обрабатывать сложные вычислительные задачи и удовлетворять потребности в обработке больших объемов данных.

До последнего времени на российском рынке были представлены только импортные модули расширения PCIe для агрегирования GPU-адаптеров, например, HPE Synergy 480 Gen10 Plus 4-slot PCIe Expansion Module или аналогичные изделия от Dell, Supermicro и других производителей.

В конце 2023 года компания Delta Computers представила свой новый продукт — GPGPU платформу Delta Sprut. Это полностью российская разработка, не имеющая аналогов на рынке. Она обеспечит максимальную производительность на многих проектах, требующих высокопроизводительных вычислений — от задач, решаемых с помощью ИИ, и до проектирования электроники, новых машин, судов и летательных аппаратов в конструкторских и архитектурных бюро.

Если предполагается работа с картами Nvidia, GPGPU платформа Delta Sprut позволяет использовать интерфейс NVLink, который попарно объединяет графические адаптеры для повышения производительности.

NVLink интерфейс — это аппаратное решение, разработанное компанией Nvidia, и представляет собой специальное коммутационное соединение между графическими процессорами (GPU). NVLink предоставляет высокоскоростную связь с низкой задержкой передачи данных, позволяя графическим картам совместно выполнять вычисления и обмениваться данными с очень высокой скоростью.

Конкурентоспособный продукт для российского рынка

CNews: Что побудило вас заняться разработкой Delta Sprut?

Андрей Чернышев: У любого российского производителя серверных решений есть одно главное ограничение — относительно малый размер российского рынка. Наша бизнес-задача — вывести конкурентоспособный продукт на рынок, при этом чтобы он не продавался в единичных количествах. Это напрямую связано с себестоимостью его производства. И продукт Delta Sprut — не исключение, изначально он задумывался как универсальная аппаратная платформа, в рамках которой можно было бы закрыть несколько потребностей в высокопроизводительных вычислениях, возникающих у заказчиков.

Наша компания активно коммуницирует с рынком, и мы понимали, что у производителей ПО и поставщиков услуг есть определенные проблемы с доступом к высокопроизводительным платформам. Это мешало им реализовывать свои амбициозные идеи. Наша разработка Delta Sprut призвана решить эту задачу.

Искусственный интеллект — одно из его самых перспективных применений Delta Sprut. До момента выхода модуля расширения на рынок в декабре 2023 года не было ни одного российского аппаратного продукта класса GPGPU, который бы помогал решать задачи масштабирования вычислительной мощности применяемых GPU-адаптеров. То есть, это универсальный продукт, на базе которого у нас подключаются графические акселераторы GPU. Мы также используем Delta Sprut как один из компонентов гибридных систем хранения Delta Argut. Он расширяет возможности Delta Argut по поддержке вплоть до 120 NVMe U.2 дисков.

CNews: Опишите, пожалуйста, принцип работы Delta Sprut.

Андрей Чернышев: Delta Sprut — это GPGPU платформа, обеспечивающая подключение дополнительных периферийных устройств PCI Express к вычислительным узлам наших серверов Delta Tioga Pass, Delta Bright Lake и, конечно, Delta Serval, главной новинки, которую мы представили буквально несколько недель назад — первого сервера отечественного производства на базе процессоров последнего поколения Intel, Sapphire Rapids и Emerald Rapids. Delta Sprut позволяет подключать к одному вычислительному узлу до 8 GPU двойной или 16 GPU стандартной толщины, что устанавливает рекорд плотности в 160 GPU в одном OCP-шасси.

Кроме того, сейчас мы в нашей лаборатории проводим испытания, готовим микрокод, который позволит GPGPU платформе «подрасти» уже до 16 GPU двойной или 32 GPU стандартной толщины соответственно.

Заказчики сталкиваются с проблемой ограничений на количество графических акселераторов GPU, которые могут быть установлены в типовые серверы. Обычно ограничение составляет не более двух или четырех GPU-адаптеров в одном сервере, а модели специализированных серверов типа Supermicro с большим числом свободных разъемов PCIe под GPU-адаптеры довольно дороги.

GPGPU платформа Delta Sprut для установки в стойку 21”

Delta Sprut помогает преодолеть ограничения в виде недостаточного числа разъемов PCIe для GPU-адаптеров в массовых моделях серверов и предоставляет разработчикам возможность обрабатывать крупные объемы данных, такие как большие графы, работа с большими объемами фото и видео, а также взаимодействовать с генеративными и семантическими моделями. Если бы не было нашего продукта, у заказчика была бы необходимость использовать больше серверов, а это дополнительные расходы.

GPGPU платформа Delta Sprut

CNews: Кому больше всего подойдет Delta Sprut, и кто станет его покупателем? Какие это сферы бизнеса?

Андрей Чернышев: Оборудование по своей сути универсально. Учитывая модульную конфигурацию, Delta Sprut может использовать графические ускорители разных моделей и от разных вендоров. В текущих условиях санкционного давления подобная универсальность позволяет говорить о несколько большей степени уверенности в дальнейших возможностях развития систем и технического обслуживания.

Потребителями Delta Sprut может быть очень широкий круг компаний. Основная целевая аудитория — это команды разработки в крупных компаниях в нашей стране, где нужны высокопроизводительные вычислительные мощности.

При этом наши клиенты — это не только большие игроки, которые используют ИИ-сервисы от Яндекса или нейросеть GigaChat от Сбера, но и те, кто локально начинают тестировать в своем бизнесе технологии искусственного интеллекта. Многие не разрабатывают софт и не создают собственные модели, а используют уже обученные нейросети от нескольких российских производителей. Они применяются в реальных корпоративных задачах для распознавания документов либо анализа различных медиафайлов.

Многие российские клиенты, кто занимается разработкой ПО, ранее покупали вычислительные ресурсы в облаке у западных провайдеров. Сейчас эти клиенты вынуждены переносить свои модели в российские дата-центры, но не все облачные провайдеры в России в состоянии предложить существенные вычислительные мощности на GPU-адаптерах. Поэтому российские дата-центры — это тоже наш клиентский фокус.

Есть еще большая ниша по применению нашего продукта — это профессиональный 3D VDI, конструкторские задачи, где есть потребность в мощном вычислительном ресурсе для рабочего места конструкторов или архитекторов. Зачастую там не использовали виртуализацию, а покупали мощную графическую станцию на каждое рабочее место. При этом подобные ресурсы использовались недостаточно эффективно, т.к. полная загрузка графического адаптера в рабочей станции была только на определенных операциях, а большую часть времени он простаивал в ожидании, пока конструктор вернется к работе с моделями. Delta Sprut как раз решает эту задачу, позволяя конструкторским бюро максимально быстро нарастить виртуальную среду для высокопроизводительных вычислений и использовать ее ресурсы для своей производственной деятельности.

Еще одна емкая сфера применения вычислений на GPU-адаптерах — это все, что связано с созданием цифровых двойников промышленных установок на предприятиях. Особенно это продуктивно для установок непрерывного цикла. С использованием цифровых двойников можно обучать персонал управлению сложными и опасными технологическими процессами, а также моделировать аварийные ситуации на установках с целью отработки навыков персонала по действиям в таких случаях. Многие потенциальные клиенты очень заинтересованы в том, чтобы российские аппаратные платформы лежали в основе данных решений, и мы со многими из таких клиентов уже работаем.

Можно сказать, что все процессы, связанные с высокопроизводительными вычислениями для задач моделирования различных технологических процессов, находятся в нашем фокусе и могут быть реализованы при помощи Delta Sprut. Например, из неочевидного на первый взгляд — это геологоразведка. В передовых российских нефтегазовых компаниях геологи уже начали успешно работать в тесной связке с ИТ-специалистами и использовать ИИ, машинное обучение и большие данные для геологоразведочных работ.

Наконец, Delta Sprut будет полезен в сфере интеллектуальных транспортных систем, в приложениях АСУДД для анализа транспортных потоков на основе стримингового видео с камер наблюдения за дорожной обстановкой, в том числе для формирования карты пробок, систем приоритетного проезда пассажирского транспорта, оперативного обнаружения и информирования об инцидентах, а также моделирования и тестирования различных ситуаций для повышения уровня безопасности и комфорта водителей и пассажиров.

Мы не можем раскрывать названия компаний наших заказчиков, но хотим поделиться некоторыми интересными цифрами. Тот объем графической памяти, который мы можем предоставить заказчику с использованием 40 наших ОСР-серверов, оснащенных 2-мя GPGPU платформами Delta Sprut, другие российские производители способны сегодня реализовать только на 80 серверах 19’’. Плюс ко всему это 80 наших юнитов против 120 юнитов у конкурентов. Здесь налицо сокращение капитальных вложений и операционных расходов, так как, кроме отсутствия необходимости покупки большего числа серверов, можно экономить на аренде стойко-мест в дата-центре, технической поддержке, дополнительных лицензиях и накладных расходах.

Соответствие архитектуре Open Compute Project

CNews: Какие технические особенности нужны для работы серверов с Delta Sprut?

Андрей Чернышев: Мы уже некоторое время назад поверили в инфраструктуру ОСP (Open Compute Project) и работаем только с этой архитектурой. Это очень похоже по структуре на хорошо всем известную концепцию Open Source, но только в мире вычислительного и сетевого оборудования, то есть это практически Open Source Hardware. В рамках этого консорциума более 300 компаний. Мы были первыми отечественным разработчиками, вступившими в сообщество.

Инфраструктура ОСР представляет собой большое блейд-шасси (шасси для установки различных инфраструктурных элементов, будь то серверы, системы хранения данных или системы интерконнекта, она подходит для абсолютно любых сфер применения и любых дата-центров. Использовать GPGPU платформу Delta Sprut может любой заказчик, здесь не потребуется специфичных навыков и знаний от персонала, а также нет особенностей применения. Delta Sprut можно установить в обычной инфраструктуре любого нашего российского заказчика.

Инфраструктура ИТ оборудования OCP (Open Compute Project) представляет собой инициативу, запущенную Facebook** в 2011 году с целью разработки открытых и стандартизированных концепций и спецификаций для серверов, сетевых устройств, хранилищ данных и другого ИТ оборудования, используемого в центрах обработки данных (ЦОД). Основная идея OCP заключается в открытом обмене дизайнами, спецификациями и решениями для создания более эффективного, гибкого и экономичного оборудования для ЦОД.

Участники OCP включают в себя крупные компании технологического сектора, в том числе Facebook**, Google, Microsoft, Intel, AMD и другие. Они сотрудничают над разработкой и совершенствованием оборудования, а также обмениваются результатами и опытом, чтобы продвигать идеи открытого оборудования в ЦОД по всему миру.

Среди традиционных преимуществ ОСР-архитектуры обычно называют универсальность и возможность использования компонентов любого производителя, высокую плотность размещения и серьезную экономию энергии. Некоторые исследования показывают, что использование концепции позволяет снизить ТСО на 30%.

Cnews: Как можно использовать Delta Sprut с уже существующими системами заказчика?

Андрей Чернышев: Очевидная часть концепции OCP — открытость, что является основным посылом к тому, чтобы можно было использовать Delta Sprut в существующей инфраструктуре и с существующими софтверными решениями, включая системы мониторинга.

GPGPU платформы Delta Sprut могут быть совершенно легко интегрированы в существующую инфраструктуру и управляться с помощью удобной многим командной строки — или могут быть подключены к системам мониторинга Delta BMC и Delta DCM, которые позволяют управлять тысячами юнитов.

Для Delta Sprut мы не используем никаких проприетарных технологий или иных частных решений эксплуатации. С точки зрения программной совместимости, Delta Sprut никак не влияет на коммуникацию GPU-адаптеров Nvidia, AMD или других с ранее разработанными моделями или кодом. Delta Sprut абсолютно прозрачен для вендорского API и представляет собой аппаратную коммуникационную корзину по объединению графических ускорителей между собой. Заказчики уже проводили множественные тесты по использованию Delta Sprut в своей среде разработки, и применение нашей GPGPU платформы не потребовало никакого изменения программного кода.

CNews: Существует ли какое-то обучение для тех, кто приобретает Delta Sprut?

Андрей Чернышев: У нас представлены два направления обучения по использованию GPGPU платформы Delta Sprut. Одно из них ориентировано на наших бизнес- и сервис-партнеров, в рамках которого проводится обучение по обслуживанию и установке данного устройства у клиентов, а также по выполнению технологического и архитектурного планирования.

Для наших конечных клиентов мы также предоставляем услуги специальной лаборатории, где они могут протестировать свои программные модели и приложения, ознакомиться с работой всех наших продуктов. В этой лаборатории наши опытные специалисты готовы оказать помощь в оптимизации производительности рассчитываемой модели или оптимизации приложения клиента (при необходимости).

Мы удовлетворены тем, что усилия, которые мы вложили в то, чтобы сделать использование Delta Sprut максимально прозрачным для существующих приложений, оказались результативными. В последних 40 тестовых сессиях нашим клиентам не потребовалось вносить изменения в код их приложений, что подтверждает успешное внедрение данного устройства и радует нас.

* Признана экстремистской и запрещена в РФ

** Признана экстремистской и запрещена в РФ

erid:LjN8Jzdf5Рекламодатель: ООО «Дельта Компьютерс»ИНН/ОГРН: 7702400690/1167746416980Сайт: https://deltacomputers.ru

Сергей Березин