Market.CNews поговорил с директором облачного бизнеса ITGLOBAL.COM Евгением Свидерским — о развитии GPU Cloud, выборе аппаратных решений под разные задачи, аренде суперкомпьютеров и партнерстве с ИИ-разработчиками.
Евгений СвидерскийITGLOBAL.COM
GPU Cloud: сценарии и архитектура
Market.CNews: Для чего компаниям может понадобиться GPU Cloud?
Евгений Свидерский: GPU — это дополнительное расширение возможностей, которое можно использовать совместно с облаком. Это инфраструктура, которая позволяет решать широкий спектр задач — от предоставления виртуальных рабочих мест с картами GPU до обучения нейросетей и автоматизации бизнес-процессов с использованием ИИ.
Market.CNews: А по каким критериям стоит выбирать провайдера GPU Cloud?
Евгений Свидерский: Прежде всего, стоит обратить внимание на доступность различных конфигураций и моделей GPU, что позволяет подобрать оптимальное решение под конкретные типы задач и уровни нагрузки.
Например, для работы с графикой, виртуальными рабочими столами и визуализацией используются профили GPU с объемом видеопамяти до 16 ГБ.
В случае задач, связанных с машинным обучением и обработкой больших объемов данных, требуются высокопроизводительные ускорители с видеопамятью от 40 ГБ и выше. Такие ресурсы могут быть объединены в кластер с помощью технологии NVLink, что позволяет сформировать вычислительный комплекс с общим пулом видеопамяти до 640 ГБ.
При этом не менее важным является не только наличие GPU, но и возможность выбрать конфигурацию под конкретный сценарий. В одних случаях на первый план выходит стоимость, и тогда подойдут недорогие серверы без резервирования — например, для тестовых или временных сред. В других — высокая производительность, требующая мощных карт с большим объемом видеопамяти. А иногда приоритетом становится высокая доступность и надежность, особенно для продуктивных сервисов — в таких случаях востребованы резервированные решения, с возможностью масштабирования.
Немаловажна и возможность кастомизации: провайдер должен уметь собрать конфигурации «под ключ», адаптировать инфраструктуру под конкретные требования клиента — вплоть до частных инсталляций.
Отдельный критерий — скорость предоставления ресурсов. Идеально, если нужная конфигурация доступна в режиме «по клику», без долгого ожидания и подготовки сервиса.
Оборудование под любые задачи
Market.CNews: Какое оборудование вы используете?
Евгений Свидерский: Мы формируем линейку оборудования так, чтобы покрыть весь спектр потребностей: от виртуальных рабочих мест с высокой плотностью пользователей, до мощных серверов с несколькими GPU для распределенных вычислений и обучения нейросетей. Мы работаем с несколькими основными сериями GPU от Nvidia. A800 и A100 — универсальные решения для вычислительных задач. H100 — одна из топовых карт с максимальной производительностью, она используется в услуге аренды суперкомпьютера.
Еще одним из решений является Nvidia A16. Это экономичное и энергоэффективное решение, оптимальное для виртуальных рабочих мест (VDI), графических приложений вроде AutoCAD, а также 3D-визуализации и моделирования.
Мы предлагаем, в том числе, и аппаратную реализацию. Например, две графические карты Nvidia L40S в ряде сценариев обеспечивают сопоставимый уровень производительности с одной A800, однако итоговый выбор зависит от специфики задач и требований к инфраструктуре.
Наша цель — предоставить заказчику готовое решение под любую задачу, будь то рендеринг, VDI, аналитика или тяжелые ИИ-нагрузки. Благодаря такому подходу мы можем предложить подходящую под конкретный сценарий рабочую конфигурацию.
Market.CNews: Вы говорили про аппаратные решения как один из вариантов построения инфраструктуры с GPU. В каких случаях аренда выделенного сервера целесообразнее аренды облачного сервера с GPU?
Евгений Свидерский: Есть несколько вариантов. Аренда выделенного сервера с GPU позволяет сократить стоимость услуги за счет отказа от виртуализации и сопутствующего администрирования. Это более дешевое решение для небольших платформ. Это базовая конфигурация с двумя картами по 48 гб видеопамяти.
Либо другой сценарий — это крупные инсталляции, в которых требуется объединить несколько GPU в единый кластер с общей графической памятью. Такие конфигурации востребованы в задачах, где приложению необходима максимальная пропускная способность между ускорителями и объединенный ресурсы нескольких графических карт.
У нас есть готовые решения под оба варианта: стартовая конфигурация с одним GPU на сервер, а также мощные серверы с 8 GPU “на борту”, которые можно масштабировать до инсталляций с совокупной графической памятью до 640 ГБ. Это полноценные графические программно-аппаратные комплексы, предназначенные для ресурсоемких вычислений.
Суперкомпьютеры и альтернативы Nvidia
Market.CNews: Расскажите об услуге аренды суперкомпьютера.
Евгений Свидерский: Это программно-аппаратный комплекс на базе серверов с 8 картами H100 и платиновыми процессорами, масштабируемый до 32 узлов — то есть до 256 GPU в единой системе. В совокупности он обеспечивает до 20 ТБ графической видеопамяти, что позволяет решать самые высокопроизводительные задачи, включая обучение крупных языковых моделей, генеративных нейросетей и выполнение распределенных ИИ-вычислений.
У клиента есть две опции: воспользоваться арендой этих мощностей в облаке или реализовать аналогичную конфигурацию на своей площадке. Во втором случае мы выступаем как интегратор — проектируем, поставляем и разворачиваем решение у заказчика. Иногда компании создают у себя симметричную ноду, а временные или проектные нагрузки передают в облако, что позволяет гибко масштабировать вычислительные ресурсы и точно планировать сроки задач.
Но это скорее сценарий ИТ-гигантов и банков. Далеко не все компании могут себе позволить покупку суперкомпьютера. Помимо изначальной значительной стоимости это требует значительных операционных расходов на поддержание оборудования, высокой квалификации сотрудников. Поэтому для небольших компаний аренда хороший выход, чтобы познакомиться с топовыми технологиями без капитальных затрат.
Market.CNews: Есть ли сейчас на рынке альтернатива Nvidia?
Евгений Свидерский: Мы регулярно тестируем новые решения.Например, недавно мы закончили тексты китайской карты Sophgo. Они пока отстают от Nvidia, как от стандарта рынка, но тоже активно развиваются. Например, в задачах компьютерного зрения Sophgo показали достойный результат.
Мы держим руку на пульсе, смотрим и тестируем новинки, чтобы в нужный момент предложить клиенту не только стандарт, но и рабочую альтернативу.
Партнерская модель и гибкость
Market.CNews: Вы развиваете GPU Cloud по партнерской модели. Что это означает?
Евгений Свидерский: Мы не ограничиваемся моделью перепродажи ресурсов. Нам важен партнерский формат, при котором на базе нашей инфраструктуры создается совместное решение с прикладной ценностью для конечного заказчика. Пример — сотрудничество с компанией Ainergy, которая разрабатывает ИИ-платформу с функциями распознавания счетов, категоризации информации и автоматизации документооборота.
Мы предоставляем им необходимые ресурсы и инфраструктуру, включая возможность масштабирования и техническую поддержку, а партнер сосредотачивается на разработке функциональности и клиентского продукта. Это позволяет нам вместе создавать полноценные бизнес-решения в формате PaaS-платформы, где клиент получает готовую ценность «под ключ», а инфраструктурные вопросы остаются на нас.
Мы также активно поддерживаем запуск пилотных проектов — особенно это актуально для стартапов, которым важно протестировать идею без высоких начальных вложений. Предоставляя инфраструктуру для таких проектов, мы помогаем партнерам ускорить развитие своих решений. В случае успешной реализации мы готовы рекомендовать эти продукты нашим корпоративным клиентам, способствуя их выходу на рынок.
Инфраструктура и гибкая тарификация
Market.CNews: Какие параметры дата-центров важны при выборе облачного провайдера?
Евгений Свидерский: При выборе мы оцениваем, насколько дата-центр соответствует требованиям надежности и безопасности. К ключевым параметрам относятся уровень отказоустойчивости — не ниже Tier III, наличие резервирования сетей и питания, а также наличие актуальных сертификатов безопасности и качества, например, PCI DSS и ISO соответственно. Важно, чтобы дата-центр предоставлял возможность подключения к нескольким провайдерам связи по разным маршрутам — это обеспечивает защиту от сбоев и высокую доступность сервисов.
Именно на такие критерии мы ориентируемся: мы сами выбираем лучшие площадки в локации, где работаем. Это позволяет построить надежную облачную инфраструктуру для конечных пользователей.
Market.CNews: На что стоит обратить внимание при выборе облачного провайдера с точки зрения тарификации?
Евгений Свидерский: В зависимости от типа услуги применяется разная модель тарификации. Для публичных облаков может использоваться оплата по факту потребления — pay-as-you-go, когда стоимость зависит от объема использованных ресурсов. Это уместно для гибких, масштабируемых сервисов.
Но для ряда решений — например, аренды выделенного сервера или частной инсталляции — применяется фиксированная ставка за конкретный набор ресурсов. Здесь биллинг строится не по времени использования, а по закрепленной конфигурации.
Важно учитывать прозрачность условий тарификации: как формируется стоимость услуг, может ли провайдер изменять тарифы, как часто это происходит и насколько такие изменения регламентированы договором. Иногда цена «на входе» кажется привлекательной, но в дальнейшем условия могут быть пересмотрены не в пользу клиента. Это особенно критично при долгосрочном планировании развития инфраструктуры, когда стабильность бюджета имеет принципиальное значение. Мы, со своей стороны, стараемся выстраивать прозрачные и предсказуемые отношения с клиентами.
Market.CNews: Какую роль облачные GPU-сервисы играют в архитектуре ИИ-приложений?
Евгений Свидерский: ИИ-сервисы, такие как виртуальные помощники или аналитические платформы, всегда опираются на вычислительную инфраструктуру — в том числе GPU. В зависимости от задач, это могут быть как виртуализированные ресурсы, так и выделенные аппаратные решения, если требуется высокая производительность.
GPU Cloud в этом случае выступает как инфраструктурный базис: часть нагрузки может обрабатываться в облаке, часть — на стороне заказчика. Такой подход особенно удобен для стартапов и продуктовых команд, которые не хотят инвестировать в дорогое оборудование, а предпочитают гибкую аренду с возможностью масштабирования.
Такой подход упрощает развертывание ИИ-сервисов, ускоряет эксперименты с нейросетями и позволяет гибко адаптироваться к меняющейся пользовательской нагрузке.
■ erid:2W5zFH4vpJLРекламодатель: ООО "ИТГЛОБАЛКОМ РУС"ИНН/ОГРН: 7838413489 /1089847323180Сайт: https://itglobal.com/ru