Nvidia Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Интеграция Инфраструктура Электроника
мобильная версия
, Текст: Татьяна Короткова

Компания Nvidia представила передовой графический ускоритель для сверхмасштабируемых дата-центров — Nvidia Tesla P100. Как сообщили CNews в Nvidia, Tesla P100, новейшее решение для платформы ускоренных вычислений Nvidia Tesla, позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU.

Nvidia Tesla P100 на базе Pascal

Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, веб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы, указали в компании. Ускоритель Tesla P100, основанный на новой архитектуре Nvidia Pascal с пятью передовыми технологиями, обеспечивает высокую производительность и экономичность для самых ресурсоемких приложений.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отметил: «Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры Nvidia совместно с технологией OpenPower уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от Nvidia с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта».

По информации Nvidia, в целом Tesla P100 — первый ускоритель Nvidia со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно, который, по задумке производителя, позволит повысить скорость обработки данных и ускорит открытия в широком спектре областей. Решение обеспечивает высокую производительность и масштабируемость благодаря использованию пяти прогрессивных технологий.

Архитектура Nvidia Pascal для экспоненциального роста производительности

По утверждению представителей компании, Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения Nvidia Maxwell.

Nvidia NVLink для масштабируемости приложений

Nvidia NVLink, высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность. NVLink позволяет связать до восьми GPU Tesla P100, повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры Power8 для высокоскоростной коммуникации между CPU и GPU.

16нм FinFET для высокой энергоэффективности

Процессор Pascal обладает 15,3 млрд транзисторов, построенных на базе 16нм процесса FinFET. Он создан, чтобы обеспечить требуемую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.

CoWoS с HBM2 для больших нагрузок

Архитектура Pascal объединяет процессор и данные в одном пакете, чтобы оптимизировать вычисления. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.

Новые алгоритмы искусственного интеллекта для пиковой производительности

Новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения, указали в Nvidia.

«Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики Amber, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах», — заявили в компании.

Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах, рассказали в Nvidia.

Обновления в Nvidia SDK

Nvidia также анонсировала ряд обновлений в Nvidia SDK, платформе разработки для GPU-вычислений. В число обновлений входит Nvidia CUDA 8. Новейшая версия платформы параллельных вычислений Nvidia представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

В то же время, компания анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний, отметили в Nvidia.

Доступность

Графические ускорители Nvidia Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения Nvidia DGX-1 в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 г.