Спецпроекты

На страницу обзора
CNewsMarket опубликовал первый рейтинг российских платформ управления данными

CNewsMarket опубликовал первый российский рейтинг платформ управления данными, успешно заместивших решения международных вендоров (в том числе SAP, Oracle, IBM и Informatica). Функциональные, архитектурные и технологические особенности систем сравниваются более чем по 100 параметрам, оценивается качество компонентов платформы для сбора, анализа и передачи данных, а также уровень технической поддержки вендора.

CNewsMarket подготовил уникальный обзор российских платформ управления данными, предназначенных для комплексной работы с разнородной корпоративной информацией. Интегрированные платформы позволяют эффективно использовать всю накопленную информацию за счет автоматизированных процессов — от загрузки до формирования итоговой отчетности в различных разрезах.

В процессе своей деятельности компании неуклонно накапливают сведения о клиентах, конкурентах, рыночной конъюнктуре, собственных операционных процессах, однако в подавляющем большинстве случаев вся собранная информация из внешних и внутренних источников практически не сводима в единую базу данных.

Платформы управления данными (Data Management Platform, DMP) необходимы для централизованного управления информацией, превращая массивы разнородных сведений в основу для аналитики и прогностических моделей. Комплексные платформы обеспечивают весь необходимый инструментарий для загрузки, хранения, контроля качества, передачи и обработки данных.

Интегральный рейтинг систем сформирован по итогам анализа более 150 различных критериев. Помимо основной группы «Функциональность» (включающей в себя около 70 параметров), оцениваются такие характеристики, как масштабируемость, отказоустойчивость, технологический стек, качество технической поддержки, формы лицензирования и другие.

Результаты рейтинга

Для каждого параметра, входящего в состав критериев, разработана балльная система оценки. Участники рейтинга ранжируются по сумме набранных баллов: чем больше баллов, тем выше место. Подробности в разделе «Правила начисления баллов».

Рейтинг российских платформ управления данными

Подробнее: Обзор «Российские платформы управления данными 2025»

Функциональность
Безопасность
Поддержка и развитие
Внедрение и лицензирование
975
315
75
55
925
295
55
65
940
255
70
70
890
240
75
40
805
225
60
65
850
190
55
40
755
250
65
60
630
150
60
45

Сравнение решений проводилось по уникальной методике, разработанной аналитиками CNewsMarket и учитывающей следующие критерии:

1. Функциональность:

  • Инструменты управления метаданными, обеспечение качества данных, контроль доступа и соблюдение политик
  • Управление качеством данных
  • Хранение данных
  • Обработка данных
  • Транспортировка и передача данных
  • Мониторинг платформы данных
  • Личный кабинет (централизованное управление платформой)
  • Модули для работы с ИИ
  • Поддержка развертывания компонент платформы на различных ОС
  • Поддержка исполнения компонент платформы в контейнерное среде
  • Поддержка развертывания и исполнения
  • Масштабируемость, доступность и отказоустойчивость
  • Поддержка аппаратных и программных кластерных конфигураций
  • Пользовательский интерфейс, формы и поиск
  • Технологический стек и совместимость с импортонезависимым системным ПО

2. Безопасность:

3. Поддержка и развитие:

  • Количество сотрудников компании, занятых в разработке и развитии продукта (баллы)
  • Количество сотрудников компании, занятых в службе поддержки (баллы)
  • Виды поддержки

4. Внедрение и лицензирование:

  • Количество реализованных проектов внедрения платформы
  • Количество проектов миграци
  • Схемы лицензирования

Топ-5 российских платформ управления данными 2025

Место
Компания
Название платформы
Итоговый балл
1
Диасофт
Digital Q.DataFactory
1 420
2
Датареон
Datareon Platform
1 340
3
Data Sapience
Data Ocean
1 335
4
DIS Grou
AI Data Platfor
1 245
5
Юзтех
Usebus AI-Code
1 155

Источник: CNewsMarket, 2025 г. Полная версия

Лидером рейтинга российских платформ управления данными стал комплексный продукт «Фабрика данных» (Digital Q.DataFactory), который является частью экосистемы Digital Q компании «Диасофт». Решение автоматизирует весь процесс обработки данных от загрузки до машинного обучения и визуализации. Платформа построена на Data Lakehouse-архитектуре, которая объединяет преимущества хранилищ данных (Data Warehouse) и озер данных (Data Lake). Одним из ключевых преимуществ платформы является low-code-подход к созданию процессов работы с данными, что значительно ускоряет разработку и снижает порог входа для инженеров.

Второе место — у платформы Datareon Platform. Она объединяет в себе возможности ETL (извлечение, трансформация, загрузка), хранилища данных, BI-аналитики и инструментов машинного обучения. Среди преимуществ решения — поддержка как вертикального масштабирования (за счет увеличения ресурсов одного сервера), так и горизонтального масштабирования через кластеризацию. Кластер работает в режиме active-active, все узлы кластера одновременно обрабатывают задачи, без единой точки отказа.

Третье место — у lakehouse-платформы Data Ocean. Архитектура решения позволяет создавать единое пространство для аналитики, интегрируя разнородные источники информации для формирования отчетных форм с обязательными процедурами проверок на предмет нарушения качества входящих данных. Команда разработчика входит в ГК GlowByte и имеет многолетний практический опыт построения и промышленной эксплуатации высоконагруженных систем обработки данных. Среди особенностей системы — наличие сразу 4 вычислительных движков: Starcocks, Trino. Impala и Spark.

Правила начисления баллов

Рейтинг построен по балльной системе. Каждому решению начислены баллы в соответствии с таблицей. Чем выше итоговая сумма баллов, тем выше место в рейтинге.

Критерий
Правило начисления баллов
1.    Наличие сертификата ФСТЭК с УД-4 и выше
20 баллов

1.     Модули для работы с ИИ


▪        Наличие MLOps

▪        Распознание неструктурированных данных (распознавание графики и текста документов)

▪        Наличие LLM для помощи в разработке кода скриптов, ML-моделей и аналитики данных


2.     Поддержка многофакторной аутентификации

3.     Наличие сервиса поддержки от вендора в режиме 24*7
15 баллов за каждый вариант

1.     Инструменты управления метаданными, обеспечение качества данных, контроль доступа и соблюдение политик


▪        Автоматическое обнаружение и каталогизация данных из различных источников (базы данных, облачные хранилища, BI-инструменты и т.д.)

▪        Метаданные: сбор, хранение и управление метаданными для всех активов данных

▪        Управление доступом и правами пользователей

▪        Контроль версий и аудит изменений в данных

▪        Визуализация происхождения данных, их преобразований и перемещений между системами (прослеживаемость данных)


2.     Управление качеством данных


▪        Профилирование данных: Анализ структуры, содержания и статистики данных для выявления аномалий

▪        Мониторинг и оценка качества данных

▪        Удаление дубликатов: Обнаружение и удаление повторяющихся записей

▪        Заполнение пропусков: Заполнение отсутствующих значений на основе правил или алгоритмов

▪        Проверка данных на соответствие бизнес-правилам и стандартам (например, проверка валидности email адресов)

▪        Контроль целостности: Проверка связей между данными (например, внешние ключи в базах данных)

▪        Проверка форматов: Убеждение, что данные соответствуют ожидаемым форматам (например, числовые поля содержат только числа)

▪        Автоматическая очистка: Настройка правил для автоматического исправления ошибок

▪        Интеграция с ETL/ELT: Включение проверок качества данных в процессы извлечения, трансформации и загрузки

▪        Отслеживание ошибок: Логирование и классификация ошибок в данных

▪        Работа с исключениями: Возможность ручной проверки и исправления данных, которые не прошли автоматическую проверку

▪        Контроль доступа к данным и их маскирование при необходимости


3.     Хранение данных


▪        Гибридное хранение: Поддержка структурированных и неструктурированных данных

▪        Партиционирование: Разделение данных на части для улучшения производительности (например, по дате или региону)

▪        Шардирование: Распределение данных между несколькими серверами для масштабирования

▪        Сжатие данных: Уменьшение объема хранимых данных для экономии места

▪        Репликация: Создание копий данных на нескольких узлах для обеспечения отказоустойчивости

▪        Резервное копирование: Автоматическое или ручное создание бэкапов данных

▪        Восстановление данных: Возможность восстановления данных после сбоев или удаления

▪        Кэширование: Хранение часто запрашиваемых данных в памяти для ускорения доступа

▪        Масштабируемость: Горизонтальное (добавление новых серверов) и вертикальное (увеличение мощности серверов) масштабирование

▪        Снимки (Snapshots): Создание моментальных снимков данных для резервного копирования и восстановления

▪        Аутентификация и авторизация: Контроль доступа к данным на основе ролей и прав пользователей

▪        Аудит: Логирование всех операций с данными для отслеживания изменений и доступа

▪        Маскирование данных: Сокрытие конфиденциальной информации (например, PII) от несанкционированного доступа

▪        Поддержка объектного хранилища S3: Возможность хранения данных в формате объектов (файлы, изображения, видео и т.д.)

▪        Автоматическое перемещение данных: Перемещение данных между классами хранения (например, из S3 Standard в S3 Glacier для архивного хранения)

▪        Удаление данных S3: Автоматическое удаление данных S3 по истечении срока хранения

▪        Поддержка протоколов: Поддержка протоколов S3 API, HTTP/HTTPS

▪        Аудит доступа: Отслеживание доступа к данным S3 и изменений

▪        Мониторинг производительности S3: Отслеживание использования ресурсов хранения

▪        Аналитика данных S3: Анализ использования данных S3 для оптимизации хранилищ


4.     Обработка данных


▪        API: Предоставление интерфейсов для интеграции с другими системами

▪        Поддержка стандартов: Совместимость с SQL, ODBC, JDBC и другими стандартами

▪        Поддержка сложных запросов: Возможность выполнения аналитических запросов (OLAP)

▪        Обработка в реальном времени: Поддержка потоковой обработки данных (например, Apache Kafka,)

▪        Машинное обучение: Интеграция с ML-фреймворками

▪        Фильтрация: Выборка данных по определенным критериям (например, SQL-запросы с условием WHERE)

▪        Аналитические запросы: Поддержка сложных аналитических операций, таких как вычисление скользящих средних, трендов и прогнозов

▪        Статистическая обработка: Вычисление статистических показателей (дисперсия, корреляция, регрессия)

▪        Потоковая обработка: Возможность обработки данных в реальном времени (например, Apache Kafka, Apache Flink)

▪        Распределенная обработка: Использование кластеров для обработки больших объемов данных (например, Apache Hadoop, Spark)

▪        Параллельные вычисления: Выполнение задач на нескольких узлах одновременно

▪        Обработка неструктурированных данных: Работа с текстами, изображениями, видео и другими неструктурированными форматами

▪        Поддержка многомерных моделей данных

▪        Поддержка операций OLAP

▪        Инструменты повышения производительности в интересах OLTP (Оптимизация, Индексация, Кэширование)

▪        Поддержка ACID-свойств транзакций: атомарности (Atomicity), согласованности (Consistency), изолированности (Isolation) и долговечности (Durability)

▪        Горизонтальное масштабирование: Возможность добавления новых узлов для обработки растущего объема транзакций

▪        Вертикальное масштабирование: Увеличение ресурсов (например, CPU, RAM) на существующих узлах


5.     Транспортировка и передача данных


▪        Извлечение данных из источников (например, базы данных, API, файлы)

▪        Преобразование данных (очистка, стандартизация, обогащение)

▪        Загрузка данных в целевые системы (например, хранилища данных, озера данных)

▪        Репликация данных (Data Replication): Создание копий данных в реальном времени или по расписанию

▪        Потоковая передача данных (Data Streaming), обработка данных в реальном времени

▪        Управление API: Создание, публикация и управление API для передачи данных

▪        Управление очередями сообщений (Message Queues)

▪        Мониторинг платформы данных

▪        Отслеживание использования CPU, памяти, дискового пространства и сетевых ресурсов

▪        Мониторинг нагрузки на серверы и узлы кластера

▪        Состояние кластера: Отслеживание состояния узлов в распределенных системах (например, в Hadoop, Kubernetes)


6.     Личный кабинет (централизованное управление платформой)


▪        Загрузка данных: Возможность загружать данные из файлов (CSV, JSON, XML) или через API

▪        Выгрузка данных: Экспорт данных в различных форматах для анализа или интеграции с другими системами

▪        Уведомления: Оповещения о проблемах с качеством данных

▪        Поиск данных: Возможность поиска данных по метаданным (например, название таблицы, описание)

▪        Описание данных: Просмотр и редактирование метаданных (например, описание таблиц, атрибутов)

▪        Происхождение и история данных (Data Lineage)

▪        Визуализация: Графическое отображение происхождения и преобразования данных

▪        Назначение ролей: Управление правами доступа на основе ролей (например, администратор, аналитик)


7.     Поддержка исполнения компонент платформы в контейнерное среде


▪        Развертывание и исполнение платформы в контейнерном кластере или многоконтейнерной среде

▪        Kubernetes

▪        K3S

▪        Docker Compose


8.     Поддержка развертывания и исполнения


▪        Централизованное и распределенное развертывание конфигураций платформы

▪        Возможность развертывания и исполнения в гетерогенной (разные OC для разных узлов и компонент) вычислительной среде и среде хранения данных


9.     Масштабируемость, доступность и отказоустойчивость


▪        Горизонтальное масштабирование за счёт управления экземплярами сервисов и узлов

▪        Вертикальное масштабирования за счёт использования аппаратных ресурсов

▪        Механизмы сохранения / восстановления платформы, настроек и данных интеграционных взаимодействий

▪        Балансировка входящей запросной нагрузки

▪        Определение и управление лимитами ресурсов


10.     Поддержка аппаратных и программных кластерных конфигураций


▪        Кластера Active-Standby

▪        Кластера Active-Active


11.     Журналирование и аудит


▪        Системное журналирование

▪        Построения графа фактического прохождения данных поданным журналов

▪        Ведение журнала изменения конфигураций приложения (процессы обработки, интеграционные процессы, объекты данных, коннекторы)

▪        Ведение и возможность настройки силами системного администратора журнала аудита действий пользователей

▪        Ведение журнала авторизации пользователей системы

▪        Встроенная защита журналов регистрации событий системы от несанкционированного уничтожения, модификации, подмены

▪        Возможность настройки различных уровней логирования

▪        Доступ или попытка доступа к ограниченному действию, объекту или отчету

▪        Несанкционированный доступ к данным


12.     Пользовательский интерфейс, формы и поиск


▪        Наличие графического редактора для настройки экранных форм для конечных пользователей, реализованного в соответствии с low-code подходом

▪        Поиск по контенту данных

▪        Поиск по объектам и разделам системы


13.     Аутентификация


▪        Аутентификация и авторизация пользователей (конечных пользователей, системных администраторов, разработчиков) осуществляется по принципу единого входа (Single Sign-On)


14.     Поддержка протоколов аутентификации:


▪        SAML 2.0

▪        SSL

▪        OpenID Connect (OIDC)

▪        Kerberos


15.     Поддержка типов аутентификации:


▪        Аутентификация на основании логина и пароля, хранящегося в приложении

▪        Аутентификация с помощью токена

▪        Поддержка механизма использования доменной аутентификации и ролей LDAP

▪        Поддержка механизма использования доменной аутентификации и ролей keycloak


16.     Использование гибкой ролевой модели (RBAC, ABAC) и возможность разграничивать права доступа:


▪        Для разработчиков интеграционных взаимодействий —  по потокам и узлам интеграционных взаимодействий, настройкам компонент, инструментам разработки и тестирования

▪        Для администраторов интеграционной платформы —  для системных и конфигурационных настроек, функции управления узлов и компонентов

▪        Для операторов и бизнес-пользователей, включая доступ к истории, отчетам, контенту и функциям обработке (пересылке) передаваемых данных и сообщений

▪        Для процессов исполнения и коннекторов —к вычислительным ресурсам и к внешним системам


17.     Шифрование и безопасность


▪        Шифрование хранящихся данных

▪        Шифрование конфигураций и настроек

▪        Симметричное шифрование

▪        Асимметричное шифрование

▪        Хэширование

▪        Обеспечение и соблюдение отраслевых правил и норм безопасности


18.     Технологический стек и совместимость с импортонезависимым системным ПО


▪        Соответствие текущим требованиям регулятора для включения в перечень отечественного ПО (работа на отечественных или импортонезависимых СУБД либо мультиплатформенность (работа с импортными, импортонезависимыми,отечественными ОС, СУБД))

▪        Соответствие текущим рекомендациям регулятора (работа на отечественных и импортонезависимых ОС и использование отечественной или импортонезависимой среды разработки)


19.     Количество реализованных проектов внедрения платформы

20.     Количество проектов миграции

21.     Количество сотрудников компании, занятых в разработке и развитии продукта

22.     Количество сотрудников компании, занятых в службе поддержки

23.     Поддержка


▪        Наличие более 1-й линии техподдержки

▪        Сообщество (в соцсетях и т.п.) для разработчиков,поддерживаемое вендором

▪        Руководства (администратора, пользователя) размещены в открытом доступе


24.     Лицензирование


▪        Модель OnPremise (на локальных серверах)

▪        Разворачивание платформы в частном облаке

▪        Гибридный формат (OnPremise и Cloud)

▪        Наличие бессрочных лицензий
10 баллов за каждый вариант

Поддержка развертывания компонент платформы на различных ОС


▪        Windows

▪        RedHat Linux (RHEL)

▪        Oracle Linux

▪        Отечественные версии Linux —  Astra, ALT, РЕД ОС


Варианты ответа: по запросу, частично, возможно
5 баллов за каждый вариант
Количество реализованных проектов внедрения платформы

1- 5 проектов = 5 баллов

6–15 проектов = 10 баллов

16–50 проектов = 15 баллов

Более 50 проектов = 20 баллов
Количество реализованных проектов миграции платформы

1-5 проектов = 10 баллов

Более 5 проектов = 15 баллов
Количество сотрудников компании, занятых в разработке и развитии продукта

1-10 человек = 10 баллов

11–50 человек = 15 баллов

Более 50 человек = 20 баллов
Количество сотрудников компании, занятых в службе поддержки

1-5 человек = 5 баллов

6–15 человек = 10 баллов

16–50 человек = 15 баллов

Перейти к обзору «Российские платформы управления данными 2025»

Обратную связь по рейтингу и обзору можно направить по электронной почте market@cnews.ru с пометкой DMP в теме письма.