Разделы

Бизнес Техника

Nvidia вдвое замедлила свой новейший GPU, чтобы легально продавать его в Китай

Американская корпорация Nvidia продает передовые графические ускорители китайским компаниям в обход экспортных ограничений США, притом совершенно не нарушая закон. Для этого чипмейкеру пришлось разработать специальную версию GPU H100 – H800 – с замедленным в два раза интерконнектом. Несмотря на искусственно ухудшенные характеристики, по словам гендиректора Nvidia, новинка пользуется спросом – эту модель, в частности, в своих центрах обработки данных внедряют Alibaba, Baidu и Tencent.

Замедленные GPU для Китая

Американская компания Nvidia поставляет в Китай свой флагманский графический ускоритель H100, модифицированный таким образом, чтобы не нарушать санкции США. Экспортная версия GPU, предназначенная для КНР, продается под иным названием – H800. Об этом сообщило агентство Reuters.

Представитель Nvidia на вопрос корреспондента агентства о том, в чем заключаются отличия моделей H100 и H800, ответил уклончиво, заявив, что «…продукция 800 серии полностью соответствует правилам экспортного контроля».

Однако по информации источника Reuters, принадлежащего к сфере производства микросхем в КНР, китайский вариант ускорителя имеет искусственно ухудшенные в сравнении с H100 характеристики пропускной способности. Интерконнект, обеспечивающий двунаправленный обмен данными GPU H800 с другими устройствами того же типа, по его словам, работает примерно вдвое медленнее флагманского H100 – на уровне 300 Гбит/с. Этот показатель оказывает значительное влияние на работу систем искусственного интеллекта, в частности на скорость обучения нейросетей.

Китайские техногиганты уже закупаются

В Nvidia заявляют, что среди компаний уже использующих H800 – такие заметные представители технологического сектора КНР как Alibaba Group, Baidu и Tencent, располагающие масштабной облачной инфраструктурой.

Nvidia под руководством Дженсена Хуанга не намерена забрасывать рынок КНР, поэтому наладила выпуск специальной экспортной версии передового GPU H100

По данным The Guardian, регуляторы в КНР ограничивают доступ населения к нашумевшей разработке OpenAIчат-боту ChatGPT на основе языковой модели GPT-3 – из опасений по поводу того, что власти США превратят его в инструмент распространения недостоверной информации.

Тем не менее интерес к подобным технологиям в Китае велик, поэтому местные технологические гиганты в конкурентной борьбе ведут разработку аналогичной модели для внутреннего рынка.

В этой ситуации облачная инфраструктура на базе новых ускорителей Nvidia придется как нельзя кстати, в частности, молодым стартапам, занятым разработкой языковых моделей, считает Дженсен Хуанг (Jensen Huang), главный исполнительный директор Nvidia.

Характеристики Nvidia H100

Nvidia анонсировала GPU H100 на базе новой архитектуры Hopper в конце марта 2022 г.

Сообщалось, что графический процессор H100 содержит 80 млрд транзисторов. H100 стал первым ускорителем с поддержкой шины PCIe Gen5 и высокоскоростной оперативной памяти HBM3. Производителем была заявлена пропускная способность памяти на уровне 3 ТБ/с. В Nvidia также утверждали, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 (архитектура Ampere) в вычислениях с плавающей запятой в зависимости от разрядности.

Новинка использует высокопроизводительную шину NVLink четвертого поколения, которая позволяет соединять между собой до 256 устройств H100.

В Nvidia заявляли, что H100 до девяти раз быстрее A100 в решении задач машинного обучения и до 30 раз – в инференсе (работе уже обученной нейросети на конечном устройстве).

Быстрая адаптация к новым условиям

В октябре 2022 г. Минторг США с подачи администрации президента Джозефа Байдена (Jospeh Biden) ужесточил правила поставок полупроводников, при разработке которых используются американские технологии, в КНР. В частности, предусматривалось введение ограничений на уровень вычислительной мощности поставляемой в Китай полупроводниковой продукции. В качестве метрики был выбрана такая характеристика интегральной микросхемы как скорость двунаправленной передачи данных (bidirectional transfer rate; BTR).

Как крупной компании мигрировать с зарубежной CRM за 4 месяца: опыт «Волга-Днепр»
Импортонезависимость

В результате некоторые китайские дизайн-центры, зависящие от производственных мощностей иностранных компаний вроде тайваньской TSMC, и другие компании, продукция которых в значительной степени ориентирована на китайский рынок, оперативно приспособили к новым условиям и начали занижать или искусственно ухудшать характеристики своих передовых микросхем, чтобы не давать своим зарубежным партнерам повода отказаться от сотрудничества по вопросу выпуска готовой продукции. Financial Times в числе выбравших этот подход называла T-Head – «дочку» Alibaba Group и Biren Technology.

Прибегнуть к модификации собственного «железа», чтобы продолжить работу с китайскими компании и одновременно с этим не попасть в число нарушителей правил экспортного контроля, была вынуждена и Nvidia. Так, в ноябре 2022 г. агентство Reuters сообщило, что американский чипмейкер подготовил специальную «китайскую» версию GPU A100 – A800, экспорт которых в КНР абсолютно легален. Как и ускоритель актуального поколения H800, его предшественник A800 отличался от немодифицированной версии пониженной BTR (примерно на треть).

Китайский высокотехнологичный бизнес сумел найти способ добраться и до оригиналов передовых GPU Nvidia. Компании, не имевшие возможности законно приобрести ускорители A100, взялись арендовать вычислительные ресурсы GPU у облачных провайдеров, а также закупаться «запрещенкой» через компании-однодневки.

В марте 2023 г. CNews сообщил о решении властей КНР скорректировать стратегию развития национальной полупроводниковой отрасли. Ее обновленная версия, в частности, предусматривает вливание колоссальных денежных ресурсов в самые успешные местные технологические компании, такие как SMIC, Huawei, Hua Hong Semiconductor, Naura и Advanced Micro-Fabrication Equipment Inc China.

Дмитрий Степанов