Место |
1 |
2 |
3 |
4 |
5 |
6 |
|---|---|---|---|---|---|---|
Компания |
«Боцман» («Группа Астра») |
Orion soft |
Сбербанк Технологии |
MWS |
Timeweb Cloud |
|
Платформа |
Платформа «Боцман» |
Nova AI |
Platform V DropApp |
MWS Container Platform |
Платформа Timeweb |
dBrain.cloud |
Рейтинг |
380 |
300 |
295 |
260 |
250 |
130 |
AI/ML-функциональность платформы |
150 |
100 |
145 |
95 |
130 |
40 |
Поддержка GPU-ускорителей в составе нод кластера |
Да |
Да |
Да |
Да |
Да |
Да |
Автоматическое обнаружение нод с GPU в сети, добавление их в кластер и управление их драйверами |
Да |
Да |
Да |
Да |
Да |
Нет |
Поддержка технологии NVLink |
Да |
Да |
Да |
Да |
Частично |
Нет |
Наличие функционала управления статическими и динамическими профилями MIG |
Да |
Да |
Да |
Частично |
Да |
Да |
Встроенный функционал предоставления GPU ресурсов задачам через очереди с гарантированным выполнением |
Да |
Да |
Да |
Да |
Да |
Нет |
Возможность динамически перераспределять ноды с GPU между кластерами Kubernetes |
Да |
Да |
Да |
Нет |
Нет |
Нет |
Автоматическое масштабирование кластеров с GPU под ИИ/ML-нагрузки на основе значимых бизнес-метрик |
Да |
Нет |
Да |
Нет |
Да |
Нет |
Возможность гибкого перераспределения ресурсов GPU кластера (время, память, мультипроцессинг) между задачами |
Да |
Да |
Да |
Да |
Да |
Да |
Наличие аналитического dashboard для контроля и мониторинга потребления GPU ресурсов ML/ИИ-нагрузками |
Да |
Да |
Да |
Да |
Да |
Да |
Встроенный алертинг по аномалиям выполняемых задач обучения или inference |
Да |
Да |
Да |
Нет |
Да |
Нет |
Встроенный в платформу low-code конструктор ИИ агентов и оркестрируемых ИИ-приложений |
Да |
Нет |
Да |
Нет |
Частично |
Нет |
Набор low-code шаблонов и элементов, стандартизирующих и ускоряющих обучение/разработку ИИ-приложений |
Да |
Нет |
Да |
Да |
Да |
Нет |
Встроенный функционал создания умных систем на базе технологии RAG и векторных баз данных |
Да |
Нет |
Частично |
Да |
Да |
Нет |
Встроенная поддержка одновременного автоматического использования spot-инстансов и постоянных узлов в рамках одного кластера доступная «из коробки» |
Да |
Нет |
Да |
Нет |
Да |
Нет |
Разработка, внедрение и эксплуатация ML-моделей в едином интерфейсе |
Да |
Да |
Да |
Да |
Да |
Нет |
Встроенные в платформу инструменты |
40 |
40 |
20 |
40 |
40 |
0 |
Встроенный инструментарий KubeFlow |
Да |
Да |
Частично |
Да |
Да |
Нет |
Поддержка задач длительного обучения (long-running training jobs) |
Да |
Да |
нет |
Да |
Да |
Нет |
Встроенные средства Ci/CD для ИИ/ML моделей |
Да |
Да |
Да |
Да |
Да |
Нет |
Встроенные средства управления и версионное хранение артефактов моделей и библиотек необходимых для их создания |
Да |
Да |
Частично |
Да |
Да |
Нет |
Встроенные в платформу notebook-серверы |
20 |
5 |
10 |
|||
Встроенные в платформу notebook-серверы |
JupyterHub + JupyterLab, Apache Zeppelin, VS Code Server, Kubeflow Notebooks |
В платформу встроен JupyterHub. Через него пользователи могут создавать notebook-окружения с нужными профилями ресурсов, подготовленными инфраструктурной командой. |
Частично |
JupyterNotebok, vscode |
Частично |
Нет |
Дополнительные встроенные в платформу инструменты |
10 |
10 |
10 |
10 |
5 |
10 |
Дополнительные встроенные в платформу инструменты |
GitFlic, GitFlic Atlas, WebShell, CD, Observability, GitOps, NetworkTraces, Snapshots, Self Service Portal, GPU Monitoring, ArgoCD, Fleet, Vault, NeuVector |
MinIO — S3-совместимое хранилище данных JupyterHub — окружение для работы аналитиков данных Airflow — автоматизация пайплайнов данных и обучения MLflow — трекинг экспериментов, версионирование моделей и артефактов KubeRay — обучение на CPU/GPU, управление задачами в кластерe Ray Train — распределённое обучение моделей Ray Tune — автоматический подбор гиперпараметров KServe — инференс и деплой моделей FluxCD — автоматизация деплоя и CI/CD моделей Prometheus — сбор метрик инфраструктуры и ML сервисов Alertmanager — алерты и нотификации Grafana — визуализация метрик и дашборды NeuVector — безопасность контейнеров и сетей StarVault — управление секретами и сертификатами ML-стека Nova Console — единый веб-интерфейс для управления платформой |
AIOps (Triton, KubeRay, Volcano, Gpu-feature-discovery, K8s-device-plugin, K8sGPT) |
Gitlab, Harbor |
Предоставляется без встроенных дополнительных инструментов. Для пользователя доступен наш собственный маркетплейс инструментов для самостоятельной установки (Kubeflow Pipelines, MLflow, Argo CD, Argo Workflows, NVIDIA GPU Operator, Prometheus, Grafana, Alertmanager, MinIO/S3 Storage, KServe, Katib, Tekton, DCGM Exporter, Istio, ModelMes) |
Авторизация: Keycloak Базы данных: PostgreSQL, MongoDB, Cassandra, Redis, ClickHouse Брокеры сообщений: Kafka, RabbitMQ Хранилище: Ceph Виртуализации: VMware Troubleshooting: Tempo, Faro, Pyroscope Мониторинг: VictoriaMetrics, Grafana, Alertmanager, Karma, Prometheus Логи: Elastic, VictoriaLogs. Сеть: Envoy, Hubble |
Безопасность и отказоустойчивость |
60 |
60 |
50 |
50 |
45 |
15 |
Поддержка GPU и всей функциональности на отечественных ОС с классом защищенности 1 |
Да |
Да |
Да |
Да |
Да |
Нет |
Поддержка изоляции и мультитенантности GPU-ресурсов на уровне namespace и projects |
Да |
Да |
Да |
Да |
Да |
Нет |
Автоматическое резервное копирование и восстановление состояния обучаемых моделей и чекпойнтов |
Да |
Да |
Частично |
Частично |
Да |
Нет |
Возможность работы в закрытом контуре |
Да |
Да |
Да |
Да |
Планируется в будущем |
Да |
Встроенные в платформу операторы |
10 |
10 |
10 |
10 |
5 |
10 |
Встроенные в платформу операторы |
PGCloudNative, KeyCloak, DEX, MariaDB, MinIO, YandexCloudProvider, BaremetalProvider, VKCLoudProvider, vSphereProvider, BRESTProvider, Vault, VictoriaLogs, Keda, VictoriaMetrics, Prometheus, GrafanaOperator, LokiOperator, cert-manager, ArgoCDOperator, Strimzi, Istio, Velero, Kyverno, Nginx, RabbitMQ, Rook, ProvisioningManager, GPUOperator,NeuVector, Longhorn Operator, NginxOperator,Descheduler |
NVIDIA GPU Operator, NVIDIA Network Operator, KubeRay |
Triton Inference Server, KubeRay, Volcano, Gpu-feature-discovery, K8s-device-plugin, K8sGPT, SGLang, k8s-rdma-shared-dev-plugin, LeaderWorkerSet (LWS) API |
Ядро: Gitlab, AI Essentials (GUI, RBAC), AI Operator (ядро AI модуля платформы), Build for Nvidia GPU Device Plugin, Build for DGCM-Exporter, Build for HAMI-webUI, Build for HAMI, AI Workbench Operator (упраление ML IDEs). Плагины: AI Model Serving Operator (Serverless инференс), Langflow |
Предоставляется без встроенных в платформу операторов. Для пользователя доступен наш собственный маркетплейс инстурментов для самостоятельной установки (NVIDIA GPU Operator, NVIDIA Device Plugin, TFJob, PyTorchJob, MPI Operator, Katib Operator, KServe Operator, Argo Workflows Operator, Velero Operator, Istio Operator) |
ClickHouse Operator Grafana Operator VictoriaMetrics Operator Percona Operators k8ssandra-operator |
Поддерживаемые системы распределенного обучения (distributed training frameworks) |
10 |
10 |
5 |
10 |
10 |
10 |
Поддерживаемые системы распределенного обучения (distributed training frameworks) |
TensorFlow + TFJob, PyTorch + Torch Distributed + PyTorchJob, Horovod + MPI Operator, Apache Spark Mllib, Volcano Scheduler + Batch Jobs |
Ray, PyTorch, TensorFlow, Horovod, DeepSpeed, vLLM |
Частично |
deepspeedz3, fsdp |
Поддерживаются все популярные системы (TensorFlow Distributed, PyTorch DDP, Horovod, Ray, XGBoost on K8s, MXNet, TorchElastic, DeepSpeed, Lightning Trainer) |
Нет |
С какими российскими ОС есть сертификаты совместимости |
60 |
50 |
30 |
20 |
0 |
30 |
ALT Linux |
АльтСервер 11 |
10.1, 10.2 |
10х |
10х |
||
AstraLinux |
1.7.x, 1.8.x, 1.7 ФСТЭК(включая Смоленск), 1.8 ФСТЭК (включая Смоленск) |
1.7.6, 1.8.1 |
1.8.x |
Работает и поддерживается на 1.7.7, 1.8.2, но формального сертификата пока нет |
В процессе тестирования |
|
МСВСфера |
9.x |
|||||
ОСнова |
Все версии |
Onyx |
||||
Ред ОС |
7.3, 7.3 ФСТЭК, 8.x |
7.3.4, 8.0 |
7 и 8 |
Работает и поддерживается на 7.3 и 8.0, но формального сертификата пока нет |
7.3, |
|
РОСА |
Хром 12 Сервер, Хром 12 Сервер ФСТЭК |
12.4 12.5 |
||||
Количество реализованных ИИ/ML проектов на базе платформы (баллы) |
10 |
5 |
15 |
5 |
15 |
5 |
Количество реализованных ИИ/ML проектов на базе платформы |
52 |
3 |
более 500 проектов |
2 |
В среднем 600 проектов в месяц |
5 |
ПО в реестре Минцифры |
10 |
10 |
10 |
10 |
10 |
|
Ссылка на ПО в реестре Минцифры |
