Спецпроекты

РСК обновила линейку решений RSC Tornado для ресурсоемких научных и прикладных задач

Интеграция Инфраструктура

Группа компаний РСК продемонстрировала на крупнейшей мировой суперкомпьютерной выставке SC19, прошедшей 18-21 ноября в Денвере (шт. Колорадо, США) дальнейшее развитие линейки унифицированных решений RSC Tornado. Новые решения РСК предназначены для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно-определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем (high performance computing, HPC), так и для эффективного хранения и обработки данных, а также для создания систем искусственного интеллекта (Artificial Intelligence, AI), систем машинного и глубокого обучения (Machine Learning, Deep Learning - ML/DL).

Среди представленных специалистами РСК новинок.

Сверхмощный вычислительный узел RSC Tornado AP на базе самых высокопроизводительных серверных процессоров новой линейки Intel Xeon Platinum 9200 (до 56 ядер на процессор). Высокопроизводительные системы хранения данных RSC Tornado AFS, предназначенные для применения, как в сфере высокопроизводительных вычислений, так и в областях машинного и глубокого обучения. Они базируются на передовом программном стеке DAOS для создания распределённых объектных систем хранения данных с поддержкой модулей энергонезависимой памяти Intel Optane DC Persistent Memory.

Кроме того, на стенде РСК были продемонстрированы широкие функциональные возможности обновленной версии программного стека RSC BasIS, предназначенного для создания, мониторинга, управления вычислительными кластерами (Cluster-on-Demand) и распределенными системами хранения данных по требованию (Storage-on-Demand).

Развитие линейки RSC Tornado позволяет на новом уровне реализовывать основные преимущества решений РСК, например, такие как: максимальная вычислительная плотность и энергоэффективность (за счет 100% жидкостного охлаждения «горячей водой» всех электронных компонент), линейная масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. При этом предоставляются дополнительные возможности для оптимизации стоимости конечных решений за счет поддержки открытых стандартов, в том числе и новых типов накопителей для систем хранения данных.

Intel Optane DC Persistent Memory, накопителей с поддержкой технологии NVMe в максимально плотном форм-факторе EDSFF (так называемые long/short ruler), а также серверных плат с поддержкой большего объема оперативной памяти, процессоров с максимальным энергопотреблением до 500 Вт на сокет, широкого набора акселераторов с энергопотреблением до 700 Вт.

В результате, обновленная линейка RSC Tornado позволит создавать системы с еще большей объемной вычислительной плотностью, широким разнообразием наборов применяемых компонент и их конфигураций для достижения максимальной эффективности конкретного решения.

В свою очередь, унификация форм-фактора монтажного шкафа, включая распределенную систему энергопитания с дублированием N+x, встроенную систему мониторинга и управления вычислительной и коммутационной компонентами, позволяет одновременно использовать в одной стойке как решения РСК со 100% жидкостным охлаждением, так и серверное и коммуникационное оборудование стандартного форм-фактора 19” (rack unit, RU) других производителей, оснащенное воздушным или комбинированным охлаждением.

Вычислительный узел RSC Tornado AP Новый высокопроизводительный узел RSC Tornado AP с поддержкой 56-ядерных процессоров линейки Intel Xeon Platinum 9200 (модель Intel Xeon Platinum 9282) и прямым жидкостным охлаждением в режиме «горячая вода» обладает максимальной теоретической (пиковой) производительностью 9,3 ТФЛОПС, имея при этом 24 канала оперативной памяти и обеспечивая поддержку объема хранения до 1,5 ТБ данных. Такой узел может комплектоваться двумя твердотельными накопителями (SSD) с поддержкой технологии NVMe в форм-факторе M.2 — например, Intel Optane SSD DC P4801X M.2 Series или Intel SSD DC P4511 (NVMe, M.2), либо двумя SSD накопителями формата E1.S (short ruler) — например, Intel SSD DC P4511 (NVMe, E1.S). В качестве опции возможно расширение системы с помощью дополнительной корзины с 6 SSD-накопителями на базе NVMe в формфакторе E1.L (long ruler) объемом до 15,36 ТБ каждый, причем с возможностью горячей замены.

Так, например, конфигурация с Intel SSD DC P4320/P4520 (NVMe, E1.L) дает возможность обеспечить объем хранения более чем 100 ТБ данных на узле с максимально быстрым доступом. Оптимальное сочетание вычислительной, сетевой и компоненты хранения данных обеспечивает необходимый баланс для построения высокопроизводительных гиперконвергентных систем с линейным масштабированием, как для достижения необходимой вычислительной мощности, так и требуемых параметров объема/скорости распределенной системы хранения.

Данный подход позволяет создавать высокопроизводительные и компактные системы, обладающие рекордными для индустрии показателями: 0,8 ПФЛОПС суммарной пиковой производительности и 8,4 ПБ объема хранения данных в одном монтажном шкафу 42U.

Системы хранения данных RSC Tornado AFS Учитывая постоянно растущие потребности клиентов в увеличении объемов хранения и скоростей обработки данных, РСК разработала совершенно новое решение RSC Tornado AFS для создания All-Flash систем хранения большого объёма на основе высокоскоростной технологии NVMe и c максимально плотным форм-фактором EDSFF.L. Новый All-Flash массив с 100% жидкостным охлаждением всех компонент «горячей водой» поддерживает до 32 твердотельных накопителей с поддержкой технологии NVMe в форм-факторе EDSFF.L с заявленной на сегодняшний день емкостью 15,36 ТБ каждый и возможностью горячей замены. Ожидаемое в ближайшем будущем удвоение емкости накопителей класса NVMe/EDSFF.L позволит увеличить объем хранения до 1 ПБ на 1 место стандартного форм-фактора 19” (1RU) без каких-либо конструктивных изменений.

Широкое использование технологии NVMe-over-Fabric (NVMeOF) предоставляет возможности для создания высокоскоростных распределенных систем со скоростями передачи данных до нескольких ТБ/с и объемом хранения до 20,64 ПБ на шкаф при поддержке различных типов параллельных файловых систем, таких как Lustre, BGFS и др.

Применение же перспективных технологий Intel Optane DC Persistent Memory и удалённого прямого доступа к памяти RDMA (remote direct memory access) открывает абсолютно новый подход для построения высокоскоростных низколатентных распределенных систем хранения данных (СХД) класса keyvalue store при помощи передового программного стека DAOS (Distributed Asynchronous Object Storage). Такие СХД предназначены для широкого использования в областях машинного и глубокого обучения.

С целью достижения оптимальной производительности особое внимание было уделено и базовой части решения, в котором применены два высокопроизводительных процессора Intel® Xeon® Scalable второго поколения, реализована возможность использования до 2 ТБ высокоскоростной памяти и до четырех модулей Intel Optane DC Persistent Memory в качестве кэшей данных 4-5 уровней. За обеспечение высокоскоростного межузлового обмена на скоростях до 200 Гб/с отвечает коммуникационная подсистема, состоящая из 2 адаптеров PCIe Gen3/4 x16 на основе технологий Intel Omni-Path, InfiniBand или Ethernet, что обеспечивает скорость доступа к данным на уровне до 25 ГБ/с на массив.

В свою очередь, логичным развитием высокоскоростной гиперконвергентной системы хранения данных RSC Tornado HS с 12-ю NVMeнакопителями стало добавление модулей энергонезависимой памяти Intel Optane DC Persistent Memory, что предоставило возможность реализации поддержки программного стека DAOS. Уместно отметить, что в недавно завершенном проекте модернизации суперкомпьютера имени Н.Н. Говоруна в Объединенном институте ядерных исследований (ОИЯИ) в г. Дубна, применение таких решений позволило достичь высочайшего уровня производительности распределенной системы хранения данных в 300 ГБ/c.

Использование гиперконвергентного решения RSC Tornado с программным стеком RSC BasIS позволяет с помощью встроенного оркестратора определять архитектуру системы хранения данных «на лету» после инсталляции оборудования, адаптируя при этом комплекс к различным типам нагрузок в соответствии с предпочтениями и задачами пользователей. При этом становится возможным создание «хранилищ-по-требованию» (storage-on-demand) с различными характеристиками для каждого из них (объем, тип файловой системы, скорость доступа, уровень надежности и безопасности, время жизни).



Взгляд месяца

Самая непростая ситуация — с импортозамещением СУБД

Денис Терещенко

заместитель руководителя ФТС

Стратегия месяца

Зачем государство ввязалось в гонку технологических вооружений

Михаил Замыцкий

директор по развитию «Ситилинк»