«К2Тех» создал вычислительный кластер для крупной машиностроительной компании
«К2Тех» совместно с «К2 НейроТех» реализовали комплексный проект «под ключ» для крупной машиностроительной компании: спроектировали и построили высокопроизводительный кластер и обеспечили бесперебойную работу вычислительного оборудования за счет тонко настроенных инженерных систем. Об этом CNews сообщили представители «К2Тех».
Заказчику требовалось создать безопасную и надежную ИТ-инфраструктуру для выполнения расчетных конструкторских задач в сфере проектирования. Предыдущий вычислительный кластер, находившийся в эксплуатации, устарел и значительно уступал в производительности и функциональности современному оборудованию.
Эксперты «К2 НейроТех» создали новый HPC-кластер на базе двухпроцессорных серверов и внедрили систему параллельного хранения дисков для достижения высокой плотности хранения данных. Использование СХД на базе открытого ПО Сeph, с полезным объемом более 600 ТБ позволило реализовать многоуровневое хранение данных и оптимизировать кэширование. Команда К2 НейроТех интегрировала имеющееся у заказчика расчетное ПО с программной инфраструктурой кластера.
Святослав Смирнов, руководитель подразделения «К2 НейроТех»: «По итогам проекта заказчик получил новый вычислительный кластер, который в три-четыре раза превосходит по мощности предыдущий в расчете на вычислительный узел. Перед нашей командой стояли амбициозные задачи: повысить производительность системы, без простоев в работе интегрировать существующий кластер и созданный, заменить устаревшие проприетарные решения на новые и обеспечить их совместимость с ИТ-системами. Нам удалось создать единое пространство, которое позволит качественно и с меньшими временными затратами осуществлять сложные расчеты при проектировании агрегатов».
Инженеры «К2Тех» разработали и запустили системы экстренного корректного отключения и автоматического включения оборудования, а также внедрили комплексную систему мониторинга для ИТ и инженерной инфраструктуры.
Для непрерывной работы вычислительного оборудования специалисты «К2Тех» с нуля оборудовали помещение инженерными системами: системой бесперебойного энергоснабжения (СБЭ), автоматической установкой газового пожаротушения (АУГП) для обнаружения возгорания и оперативного тушения, системой кондиционирования технологических помещений (СКТП), монтажными конструктивами для размещения серверов и системой кабельных каналов для организации слаботочных и силовых коммуникаций инфраструктуры кластера.

Установленные источники бесперебойного питания способны обеспечить получасовую автономную работу при полном отключении электроснабжения. На случай более длительных перебоев инженеры «К2Тех» настроили систему корректного отключения и последовательного ввода оборудования в рабочее состояние при возобновлении питания.
СКТП обеспечивает оптимальные условия эксплуатации в широком диапазоне вычислительных нагрузок. Для этого специалисты «К2Тех» применили схему с изолированным горячим коридором и «открытым» холодным. Такая концепция позволяет использовать объем помещения как буфер, чтобы система кондиционирования успела отреагировать на резкий рост нагрузки на кластер.
Сергей Махлин, руководитель центра экспертизы по ЦОД «К2Тех»: «Поскольку серверы задействуют до 100% вычислительных мощностей, разница в тепловыделении кластера при максимальной загрузке и в режиме простоя достигает 400% – подобный разброс затрудняет стабильную работу кондиционеров. Мы изучили спектр нагрузок и произвели тонкую настройку параметров, чтобы СКТП работала в штатном режиме без лишних переключений во всем диапазоне вычислительной нагрузки. Это позволит увеличить ресурс эксплуатации оборудования заказчика».