Разделы

ИТ в госсекторе Техника

NASA «тормозит» с исследованием космоса. Виноваты перегруженные старые суперкомпьютеры, к которым не пробиться из-за очередей

Длинные очереди к суперкомпьютерам, перегруженное и устаревшее оборудование, сомнительные практики обеспечения ИБ и организации управления вычислительной инфраструктурой – вот неполный перечень проблем NASA, выявленных в ходе аудита. Трудности, с которыми сталкивается персонал агентства, способствуют возникновению задержек при подготовке космических миссий.

Суперкомпьютерные проблемы NASA

Суперкомпьютеры Национального управления по аэронавтике и исследованию космического пространства США (NASA) перегружены работой и не способны удовлетворить потребности персонала в вычислительных ресурсах и в целом устарели, пишет The Register со ссылкой на результаты внутреннего аудита агентства.

В сложившейся ситуации отдельные команды сотрудников NASA вынуждены самостоятельно развертывать дополнительную инфраструктуру, чтобы избежать простоев и задержек при реализации комических миссий, однако они все равно случаются.

Одна из серьезных проблем, упомянутых в аудиторском отчете, заключается в неправильном распределении обязанностей по управлению вычислительной инфраструктурой агентства. Эти функции в NASA возложены на участников программы научных исследований Земли, которую реализует Управление научных миссий NASA (SMD), тогда как проверяющим оптимальной представляется централизованная модель.

Директор NASA по информационным технологиям (CIO) наделен некоторыми надзорными полномочиями, однако не принимает непосредственного участия в управлении суперкомпьютерами организации.

Мощностей на всех не хватает

Специалисты фиксируют острый дефицит и чрезмерную загруженность действующих собственных вычислительных мощностей NASA. Подобная проблема наблюдается во всех отделениях американского аэрокосмического агентства за исключением Центра космических полетов Годдарда (GSFC) в Гринбелте (штат Мэриленд) и Космического центра имени Джона Стенниса (округ Ханкок, штат Миссисипи).

Инженеры NASA страдают из-за нехватки суперкомпьютерного времени

Чтобы не стоять в виртуальной очереди к суперкомпьютерам и не допускать простоев в реализации проектов, отделения агентства вынуждены самостоятельно «добирать» недостающие ресурсы, в частности, развертывая независимые вычислительные мощности за свой же счет. Одна лишь команда проекта Space Launch System («система космических запусков») расходует на инфраструктуру $250 тыс. в год.

У NASA, как выяснилось, отсутствуют четко сформулированные правила относительно того, в каких случаях совершенно необходимо использовать локальную инфраструктуру, а в каких допустимо привлекать к работе над проектами облачные сервисы.

Безопасность под угрозой

Аудит также выявил, что разрозненный парк вычислительной техники NASA страдает от недостатков в сфере безопасности.

Мониторингу отдельных его сегментов не уделяется достаточно внимания, что представляет собой большую проблему, поскольку к некоторым из них имеется доступ у иностранных партнеров организации.

Правила безопасности нередко игнорируются персоналом или вовсе не установлены, говорится в отчете.

Технологическая отсталость – бич организации

Другая немаловажная проблема, вскрывшаяся в ходе проверки, – NASA явно не выдерживает темпа развития технологий и запаздывает с модернизацией собственного «железа».

Так, главный суперкомпьютер агентства имеет всего лишь 48 GPU при 18 тыс. процессоров общего назначения, в то время как все большую популярность набирают вычисления на GPU. Для сравнения: коммерческий суперкомпьютер «Яндекса» «Червоненкис», занимающий 36 место в рейтинге top500 мощнейших ЭВМ мира, располагает 1592 современными GPU Nvidia A100.

Ответственные за поддержку инфраструктуры NASA лица называют сразу несколько факторов, которые обуславливают технологическую «отсталость» организации. Среди них: опасения по поводу надежности цепочек поставок при закупках оборудования, необходимость параллельного внедрения новых софтверных технологий, а также нехватка квалифицированных кадров.

Рекомендации проверяющих

Аудиторы сформулировали 10 базовых рекомендаций, направленных на устранение выявленных проблем. Экспертами подчеркнута важность пересмотра подхода к управлению имеющейся и развертыванию новой высокопроизводительной вычислительной инфраструктуры, что входит в компетенцию руководителей высшего звена организации.

Как с помощью ad-hoc инструмента снизить расходы на внедрение аналитики
Импортонезависимость

Кроме того, предложено создание специальной рабочей группы, которая, оценит уровень технологического отставания организации и предложит методы его устранения; выработает стратегию по совершенствованию подходов к выделению ресурсов и расстановке приоритетов выдачи доступа к ним, в том числе определит, когда целесообразно использование облачных ресурсов вместо on-premise-мощностей; оценит киберриски, связанные с эксплуатацией имеющегося «железа» и по итогам установит требования к надзору и мониторингу инфраструктуры, поможет устранить существующие недостатки в этой сфере.

Команде также будет необходимо провести инвентаризацию активов, составляющих суперкомпьютерную инфраструктуру NASA и формализовать процедуры управления жизненным циклом софта и «железа» организации.

Как отмечает The Register, в руководстве NASA согласились с необходимостью мер, предложенных аудиторами, в том числе предполагающих реформирование аппарата управления суперкомпьютерной инфраструктурой организации.

В августе 2021 г. CNews писал о результатах исследования кибербезопасности в федеральных агентствах США. По данным отчета “America’s Data still at Risk”, усилия по обеспечению ИБ четырех из восьми проверенных американских ведомств были оценены аудиторами как неудовлетворительные, еще три сработали «на троечку» и лишь одно правительственное агентство смогло порадовать инспекторов.

Дмитрий Степанов