У главного суперкомпьютера РАН появился шанс не вылететь из мирового Топ 500

Бизнес Интеграция ИТ в госсекторе
мобильная версия
, Текст: Денис Воейков

Оказавшийся на гране вылета из престижного мирового рейтинга мощнейших суперкомпьютеров мира главный вычислитель РАН получил шанс остаться в этом списке за счет проходящей сейчас модернизации кластера. Однако вопросы о том, какой именно производительности он достигнет, и станут ли его хозяева подавать новые данные в рейтинг, являются открытыми.


Апгрейд главного суперкомпьютера РАН

Производительность главного суперкомпьютера Российской академии наук (РАН) МВС-10П, базирующегося в ее Межведомственном суперкомпьютерном центре (МСЦ) в ближайшие месяцы будет существенно увеличена. Это может позволить данному кластеру остаться в списке мощнейших вычислителей мира Топ 500, в котором он сейчас занимает лишь 459 строчку и без апгрейда наверняка покинет рейтинг при его очередном (происходит раз в полгода) обновлении в июне 2017 г. под натиском новых водимых в эксплуатацию машин.

Наращивание вычислительных мощностей МСЦ произойдет в рамках исполнения контракта по итогам отыгранного в декабре 2016 г. тендера на поставку соответствующего оборудования. На электронный аукцион пришла только одна заявка — от компании «РСК технологии», которая изначально создала МВС-10П в 2012 г., поэтому договор был заключен с ней без снижения стартовой цены — за p114,48 млн.

До 31 марта 2017 г. РСК должна будет поставить в МСЦ не менее 88 вычислительных узлов суммарной пиковой производительности не менее 102 Тфлопс.

Суперкомпьютерные мощности МСЦ РАН готовятся к апгрейду

Кроме того, в декабре 2016 г. «РСК технологии» стали единственным участником аукциона на проведение капитального ремонта МВС-10П. В рамках полученного по его итогам контракта на p30 млн компания также до 31 марта должна будет заменить 27 вычислительных узлов, ненадлежащая работа которых, как следует из техзадания, сейчас негативно влияет на фактическую производительность существующей (немодернизированной) системы.

История кластера

МВС-10П был введен в эксплуатацию в 2012 г. с пиковой производительностью 523,8 Тфлопс и производительностью на специализированном тесте Linpack в 375,7 Тфлопс. Последний из этих параметров определил ранжирование системы в рейтинге Топ 500 — в ноябре 2012 г. вычислитель занял в нем 59 строку.

Фрагмент названия суперкомпьютера «10П» подразумевал, что система может быть расширена до пиковой производительности в 10 Пфлопс, и в МСЦ в 2012 г. строили планы по его быстрой и существенной модернизации до указанного значения. Однако все последующие годы заявленная в Топ 500 производительность МВС-10П ни разу не менялась, поэтому с каждым новым обновлением рейтинга кластер терял позиции.

При этом анализ сайта госзакупок показывает, что, начиная с 2014 г., МСЦ (либо его вышестоящая организация) несколько раз проводили конкурсные процедуры, названия которых подразумевают поставки оборудования для апгрейда МВС-10П. За исключением одного незначительного по сумме тендера, победителем везде становилась РСК.

Так в июле 2014 г. компании достался контракт на p30,096 млн, в ноябре 2014 г. — на p9,804 млн, в ноябре 2015 г. — на p39,970 млн, в сентябре 2016 г. — на p41,258 млн.

Что именно апгрейдилось или несколько подсистем МВС-10П

Вопрос о том, куда именно пошло закупленное на 120 млн дополнительное оборудование, в группе РСК объяснили CNews появлением вспомогательных по отношению к МВС-10П подсистем.

«Во второй половине 2014 г. специалистами РСК был установлено функциональное расширение суперкомпьютера МВС-10П на базе массивно-параллельной архитектуры RSC PetaStream, а именно дополнительная вычислительная система МВС-10П МП на базе 64-х новейших и самых производительных на том момент процессоров Intel Xeon Phi 7120D. — указывают в компании. — Ее пиковая производительность составила 77,33 Тфлопс. То есть суммарная пиковая производительность вычислительных ресурсов МСЦ РАН к концу 2014 г. достигла 601,16 Тфлопс».

Также в РСК указывают, что в конце 2015 г. и в 2016 г. в МСЦ на процессорах Intel Xeon E5-2600 v3/v4 были модернизированы МВС-10П, МВС-10П МП, а также запущена еще одна безымянная подсистема и реализовано высокоскоростное межсоединение Intel Omni-Path.

Как можно судить по данным локального рейтинга самых мощных суперкомпьютеров России и стран СНГ Топ 50, в результате указанных работ при неизменной пиковой производительности в 523,83 Тфлопс производительность МВС-10П по Linpack выросла c 375,7 до 383,21 Тфлопс. Заявленные показатели МВС-10П МП остались прежними по сравнению с 2014 г., а достигнутые показатели новой безымянной системы составили 48,92 и 45,90 Тфлопс соответственно.

«Итого суммарная пиковая производительность вычислительных систем РСК в МСЦ на данный момент составляет 650,08 Тфлопс, то есть относительный прирост их производительности с 2014 по 2016 гг. превысил 24%», — резюмируют в РСК.

При этом в компании добавляют, что несмотря на взаимосвязанность систем МСЦ и возможность выполнять на них те или инфе расчеты одновременно, в рейтинги можно подавать показатели производительности только по отдельным кластерам, потому что тест Linpack не позволяет эффективно запускать его на распределенных вычислительных ресурсах.

Продвинется ли МВС-10П в Топ 500?

В какой мере новая модернизация, которая должна завершиться до 31 марта 2017 г. затронет МВС-10П, а в какой его подсистемы, CNews выяснить у РСК и у МСЦ не удалось. В РСК сообщили, что пока работы не завершены и не получено разрешение от заказчика на публичное представление информации («что является обычной практикой в этой сфере деятельности»), компания не может разглашать все подробности выполняемых проектов. «Однако можно отметить, что после их окончания суммарная пиковая производительность суперкомпьютерных систем РСК в МСЦ РАН вырастет почти на 40% по сравнению с концом 2014 г.», — добавили в РСК.

Также в компании обратили внимание, что проведение тестов и подача их результатов в рейтинги — дело добровольное. «Важно понимать, что МСЦ приобретает вычислительные системы для решения вполне конкретных прикладных задач, стоящих перед научными коллективами РАН и другими сторонними организациями, а не для участия в рейтингах, — рассуждают в РСК. — Кроме того, для проведения бенчмарка типа Linpack требуется полная остановка всех других работ в центре на достаточно длительный срок. Это практически невозможно, так как текущие пользователи их систем имеют четкие планы по выполнению расчетов».

В понимании РСК, обычно полный набор тестов, включая Linpack, проводится на этапе первичной установки суперкомпьютера, когда он проходит приемные испытания или опытную эксплуатацию, и такие результаты тестирования обновляются очень редко — «почти никогда».

От себя добавим, что многолетний анализ рейтингов Топ 500 и Топ 50 позволяет говорить о том, что последнее утверждение не соответствует действительности. Кластеры регулярно модернизируются, новые Linpack прогоняются, измененные данные подаются в рейтинговые комиссии — это не более чем рядовое явление.

В самом МСЦ на момент выхода материала никак не прокомментировали CNews свои планы в отношении новой прогонки Linpack и подачи заявки в Топ 500.

Лидеры рейтингов

Отметим, что на сегодня первую строчку в обновившемся в ноябре 2016 г. рейтинге Топ 500 занимает китайский суперкомпьютер Sunway TaihuLight с пиковой производительностью в 125,4 Пфлопс и производительностью по Linpack в 93 Пфлопс.

Самый мощный российский кластер «Ломоносов 2» из Московского госуниверситета производства компании «Т-платформы» имеет показатели 2,96 и 2,1 Пфлопс соответственно. При этом они не были таковыми изначально — МГУ после апгрейда прогонял новый Linpack. В ближайшее время ожидается его очередная модернизация.