Новый графический чип обошелся Nvidia в $3 млрд

Интеграция Электроника Техника
мобильная версия
, Текст: Владимир Бахур
Nvidia представила ряд новых технологий в области машинного обучения, ИИ и «облаков», а также анонсировала новые направления сотрудничества с Toyota и SAP. Разработка чипа Volta GV100 в новой архитектуре обошлась компании в $3млрд.

Новое поколение производительной графики

Nvidia в рамках конференции GTC 2017 анонсировала новое поколение графической архитектуры Volta, первый графический процессор Volta GV100 на его основе, а также первый графический ускоритель на этом чипе – Tesla V100, предназначенный для работы в составе производительных дата-центров.

По словам Дженсена Хуанга (Jen-Hsun Huang), представившего новую архитектуру, разработка чипа обошлась компании примерно в $3 млрд. Новый чип содержит более 5000 потоковых процессоров, новые исполнительные блоки Tensor для увеличения производительности в матричных вычислениях. Процессор Volta GV100 также обладает кеш-памятью первого и второго уровней, текстурными блоками, контроллером VRAM, системным интерфейсом и по 8 блоков Tensor на мультипроцессорный кластер (SM), в сумме 672 блоков.

Как отметил в своем выступлении Дженсен Хуанг, архитектура Nvidia Volta призвана стать катализатором новой волны достижений в области искусственного интеллекта и высокопроизводительных вычислений. Первый процессор на базе Volta – GPU Tesla V100, разработан специально для дата-центров и обеспечивает высокую скорость и масштабируемость обучения и взаимодействия глубоких нейронных сетей, а также ускоряет высокопроизводительные и графические вычисления.

Подробности о новой архитектуре

Volta представляет собой седьмое поколение графических архитектур Nvidia. По данным компании, чип обеспечивает производительность задачах в глубокого обучения, эквивалентную производительности 100 современных процессоров.

Дженсен Хуанг, глава Nvidia, представляет процессор Volta

Пиковая производительность Volta в 5 раз выше предыдущей архитектуры Nvidia Pascal и в 15 раз выше производительности представленной два года назад архитектуры Nvidia Maxwell. По данным компании, темпы роста производительности графических архитектур Nvidia вчетверо больше того, что предсказывал закон Мура.

Новый процессор содержит порядка 21,1 млрд транзисторов, площадь его кристалла составляет 815 кв. мм.

Графический процессор Volta GV100

Выпуском графических процессоров Nvidia GV100 займется тайваньский производственный холдинг TSMC. Чипы будут производиться по технологическому процессу FFN с соблюдением норм 12-нм.

В Nvidia планируют, что архитектура Volta станет новым стандартом высокопроизводительных вычислений. Благодаря объединению ядер CUDA и нового ядра Volta Tensor в унифицированной архитектуре, один сервер на базе GPU Tesla V100 сможет заменить сотни центральных процессоров в высокопроизводительных вычислениях. Матричные вычисления в блоках Tensor увеличивают производительность нового ядра в задачах машинного обучения до 120 Тфлопс, быстродействие GV100 в вычислениях с точностью FP32 составляет 15 Тфлопс, FP64 7,5 Тфлопс.

Дженсен Хуанг, глава Nvidia, рассказывает о воможностях архитектуры Volta

Список ключевых технологий GPU Tesla V100, которые позволили преодолеть 100-терафлопсный рубеж в задачах глубокого обучения, включает специализированные ядра Tensor, созданные для ускорения работы искусственного интеллекта. Оснащенный 640 ядрами Tensor, процессор V100 обеспечивает производительность 120 терафлопс в глубоком обучении, что эквивалентно производительности 100 CPU.

Новый GPU для дата-центров

Интерфейс NVLink поднимает на новый уровень скорость взаимодействия между графическими и центральным процессорами, вдвое увеличивая пропускную способность по сравнению с предыдущим поколением NVLink.

Графическая память HBM2 DRAM с производительностью до 900 ГБ/с, разработанная совместно с Samsung, увеличивает полосу пропускания на 50% по сравнению с предыдущим поколением. Ядро Volta GV100 взаимодействует с буферной памятью HBM2 по 4096-битной шине. 

Тактовая частота ядра Volta GV100 составляет 1455 МГц. Энергопотребление ускорителя Tesla V100 не превышает 300 Вт, что практически сравнимо с показателями ускорителя предыдущей архитектуры Tesla P100.

Графический процессор Volta GV100

В рамках анонса также было представлено программное обеспечение с оптимизацией под архитектуру Volta, включая CUDA, cuDNN и TensorRT.

Новые суперкомпьютеры DGX на базе Volta 

Вместе с новой архитектурой Nvidia также представила обновленную линейку суперкомпьютеров с искусственным интеллектом DGX AI. Системы построены на GPU Nvidia Tesla V100 и используют полностью оптимизированное для задач ИИ программное обеспечение. 

Суперкомпьютеры DGX на базе Volta

Производительность такой системы втрое выше, чем у предыдущего поколения DGX, и соответствует мощности примерно 800 CPU в рамках всего одной системы.

Платформа Nvidia GPU Cloud 

Новая Nvidia GPU Cloud (NGC) представляет собой облачную платформу с удобным удаленным доступом для разработчиков — с помощью ПК, системы DGX или облака, к полноценному набору инструментов внедрения ИИ. 

Благодаря NGC, разработчики смогут получать доступ к новейшим оптимизированным фреймворкам и передовым ускорителям.

Nvidia и сотрудничество с Toyota 

На GTC 2017 также было объявлено о сотрудничестве Nvidia и Toyota.

Toyota планирует начать внедрение автомобильной вычислительной платформы с поддержкой искусственного интеллекта Nvidia DRIVE PX в системы автономного вождения, запланированные к выводу на рынок в течение ближайших лет. 

Команды инженеров обеих компаний уже работают над созданием программного обеспечения на ИИ-платформе Nvidia, которое позволит лучше понимать огромные объемы данных, получаемых с автомобильных датчиков, и автономно справляться с широким спектром ситуаций на дороге.

Для того чтобы справляться с задачами подобного уровня вычислительной сложности, в прототипах автомобилей зачастую используют мощные компьютеры, которые занимают весь багажник. Платформа Nvidia DRIVE PX на базе процессора нового поколения Xavier помещается в руке, обеспечивая при этом до 30 млрд операций глубокого обучения в секунду.

Проект SAP Brand Impact 

На конференции был представлен проект SAP Brand Impact на базе решений Nvidia для глубокого обучения. Проект обеспечивает измерение атрибутов бренда – например, логотипов, практически в реальном времени. 

Эффективный анализ видеоконтента стал возможен благодаря использованию для анализа глубоких нейросетей, обученных на Nvidia DGX-1 и TensorRT.

Проект SAP Brand Impact

«С такими партнерами как Nvidia, наши возможности безграничны, - отметил CIO SAP Юрген Мюллер (Juergen Mueller). – Новые приложения, беспрецедентная производительность с нынешних приложениях и простой доступ к сервисам машинного обучения обеспечит вам высокий уровень интеллекта вашего собственного предприятия».

О конференции GTC 2017 

Ежегодная конференция Nvidia по GPU-технологиям – GPU Technology Conference (GTC), проходит на этой неделе в Сан-Хосе, Калифорния. 

В конференции принимают участие порядка 7000 специалистов, для которых будет представлено около 600 технических сессий, 150 стендов, 310 сессий по искусственному интеллекту и 67 лабораторий по технологиям глубокого обучения (Deep Learning).