В ТГУ построен первый в России суперкомпьютерный центр мирового уровня

Интеграция Инфраструктура
мобильная версия

Компания «Т-Платформы», Институт Программных Систем РАН, корпорация Intel и корпорация Microsoft объявляют о завершении строительства Регионального центра коллективного пользования высокопроизводительными вычислительными ресурсами Томского государственного университета. ТГУ, старейший университет Сибири и Дальнего Востока, стал первым российским вузом, оснащенным суперкомпьютерным центром мирового уровня: сегодня это один из 15-ти самых современных и производительных вычислительных центров в мировой системе образования. ТГУ получил возможность создать суперкомпьютерный центр как один из победителей Всероссийского конкурса инновационных образовательных программ, проведенного в рамках Национального проекта «Образование» в 2006 г.

Вычислительный центр ТГУ оснащен суперкомпьютером «СКИФ Cyberia» на базе 566 двухъядерных процессоров Intel Xeon серии 5150, ставшим самым мощным вычислительным комплексом на территории России, СНГ и Восточной Европы, а также одним из ста мощнейших компьютеров мира. Пиковая производительность «СКИФ Cyberia» составила 12 триллионов операций в секунду; предварительный результат системы на стандартном тесте Linpack составил 8,945 Тфлопс.

Суперкомпьютер ТГУ, созданный силами компании «Т-Платформы» при активной поддержке и участии специалистов ИПС РАН, является отечественной разработкой, не использующей готовые платформенные решения от ведущих мировых производителей. Сегодняшний успех российских разработчиков — результат их участия в российско-белорусской государственной суперкомпьютерной программе «СКИФ», осуществленной в 2000–2004 гг. и завершившейся строительством 288-узлового кластера «СКИФ К-1000».

«Сегодня, через два года после окончания первого этапа программы "СКИФ" Союзного государства, мы можем в полной мере оценить ее главный результат. Программа сформировала в нашей стране активную, быстрорастущую суперкомпьютерную отрасль. Она также создала команду отечественных разработчиков, способную поддерживать отрасль на пике мировых достижений. Благодаря союзной программе Россия сегодня собственными силами обеспечивает свою экономику одним из важнейших стратегических ресурсов, который лежит в основе конкурентоспособности, безопасности и процветания ведущих мировых держав», — заявил государственный секретарь Союзного государства Павел Бородин.

Основу суперкомпьютерного комплекса «СКИФ Cyberia» составляет вычислительный кластер на базе 282 вычислительных и 1 управляющего узла в конструктиве 1U на базе 566 двухъядерных процессоров Intel Xeon 5150. Благодаря технологиям Intel мощность нового «СКИФа», по сравнению со «СКИФ К-1000», выросла в 5 раз, причем количество использованных вычислительных узлов и энергопотребление кластера остались на прежнем уровне.

При разработке платформы для вычислительного узла «СКИФ Cyberia» инженеры «Т-Платформы» использовали технологии термодизайна, полученные в ходе реализации программы «СКИФ» и доказавшие свою надежность. Вычислительный узел базируется на специально модифицированной по заказу разработчиков материнской плате: для достижения наилучшей производительности вычислительных задач стандартный серверный набор микросхем заменили на чипсет Intel 5000x, обычно применяющийся для строительства графических станций. Максимально высокий уровень производительности пользовательских приложений также призван обеспечить впервые примененные в России технологии системной сети QLogic InfiniPath и системы хранения данных T-Platforms ReadyStorage ActiveScale Cluster. Система хранения данных «СКИФ Cyberia», разработанная специально для кластерных систем, обеспечивает прямой параллельный доступ всех вычислительных узлов к данным, устраняя узкие места традиционных сетевых хранилищ. Уникальная особенность выбранного решения — великолепная масштабируемость: при подключении новых модулей хранения возрастает не только объем хранилища, но и пропускная способность всей системы. Комфортный мониторинг и управление кластером обеспечивает сервисная сеть СКИФ ServNet разработки ИПС РАН.

Помимо стандартного набора управляющего и системного ПО «СКИФ Cyberia» использует новую операционную систему Microsoft Windows Compute Cluster Server 2003. Привычная среда разработки новой ОС и легкость интеграции с существующей инфраструктурой и приложениями призваны облегчить и ускорить процесс создания приложений для высокопроизводительных вычислений.

Комплексный экологический мониторинг атмосферы и гидросферы, контроль за разливом рек, распространением пожаров и эпидемий, рациональное использование лесных и минеральных ресурсов, новые конкурентоспособные методы разведки нефтегазовых месторождений, восстановление загрязненных почв, проектирование ракетно-космической техники и безопасного шахтного оборудования, создание новых видов ракетного топлива и сверхтвердых покрытий с помощью нанотехнологий — вот лишь малая часть сложнейших задач, которые ученые ТГУ будут решать с помощью «СКИФ Cyberia» в тесном сотрудничестве с предприятиями региона. Исследования в области применения параллельных вычислений ведутся в университете с 1992 г.; «СКИФ Cyberia» позволит вывести их на новый уровень. «Мы планируем создать на базе "СКИФ Cyberia" распределённую систему суперкомпьютерных вычислений. Базовый компьютер в Томске будет доступен удаленно очень широкому кругу пользователей Краснодара, Бийска, Новосибирска, Москвы. Думаю, к концу этого года мы будем иметь такую распределённую вычислительную систему, которая будет служить не только нам, но российскому образовательному сообществу в целом. В лице «Т-Платформы» мы нашли очень хорошего партнера, с которым мы будем продолжать работать в плане развития Регионального центра», — сообщил ректор Томского государственного университета Георгий Майер.

Комплексное решение «Т-Платформы» для ТГУ стало первым в России коммерческим проектом в области высокопроизводительных вычислений, включившим не только поставку вычислительной системы, но и организацию всей инфраструктуры суперкомпьютерного центра «под ключ». Система бесперебойного электропитания «СКИФ Cyberia» с максимальной мощностью 160 кВт обеспечивает подачу напряжения с заданными характеристиками на все компоненты вычислительной системы, а также защиту от сбоев в подаче электропитания. Она способна обеспечить работу суперкомпьютера в течение 10 минут после отключения электропитания, что позволяет гарантировать сохранность пользовательских данных в аварийной ситуации. Модульное строение системы позволяет использовать внутреннее резервирование и горячую замену компонентов в процессе работы. Применение традиционного воздушного охлаждения оказалось невозможным в силу небольшой площади помещения вычислительного центра ТГУ. Для обеспечения надежной работы оборудования в таких условиях инженерами «Т-Платформы» была спроектирована смешанная воздушно-водяная система охлаждения с уровнем резервирования N+1 на всех уровнях. Блоки кондиционеров, расположенных в ряду монтажных шкафов, обеспечивают забор горячего воздуха непосредственно из вычислительных узлов. Затем горячий воздух охлаждается водой в теплообменниках и подается холодным с передней стороны вычислительных стоек. Нагретая вода охлаждается фреоном в холодильных установках, конденсаторы которых располагаются на крыше вычислительного центра.