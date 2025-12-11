1. Наличие сертификата ФСТЭК с УД-4 и выше

15 баллов за каждый вариант

▪ Наличие LLM для помощи в разработке кода скриптов, ML-моделей и аналитики данных

1. Модули для работы с ИИ

1. Инструменты управления метаданными, обеспечение качества данных, контроль доступа и соблюдение политик

▪ Автоматическое обнаружение и каталогизация данных из различных источников (базы данных, облачные хранилища, BI-инструменты и т.д.) ▪ Метаданные: сбор, хранение и управление метаданными для всех активов данных ▪ Управление доступом и правами пользователей ▪ Контроль версий и аудит изменений в данных ▪ Визуализация происхождения данных, их преобразований и перемещений между системами (прослеживаемость данных)

2. Управление качеством данных

▪ Профилирование данных: Анализ структуры, содержания и статистики данных для выявления аномалий ▪ Мониторинг и оценка качества данных ▪ Удаление дубликатов: Обнаружение и удаление повторяющихся записей ▪ Заполнение пропусков: Заполнение отсутствующих значений на основе правил или алгоритмов ▪ Проверка данных на соответствие бизнес-правилам и стандартам (например, проверка валидности email адресов) ▪ Контроль целостности: Проверка связей между данными (например, внешние ключи в базах данных) ▪ Проверка форматов: Убеждение, что данные соответствуют ожидаемым форматам (например, числовые поля содержат только числа) ▪ Автоматическая очистка: Настройка правил для автоматического исправления ошибок ▪ Интеграция с ETL/ELT: Включение проверок качества данных в процессы извлечения, трансформации и загрузки ▪ Отслеживание ошибок: Логирование и классификация ошибок в данных ▪ Работа с исключениями: Возможность ручной проверки и исправления данных, которые не прошли автоматическую проверку ▪ Контроль доступа к данным и их маскирование при необходимости

3. Хранение данных

▪ Гибридное хранение: Поддержка структурированных и неструктурированных данных ▪ Партиционирование: Разделение данных на части для улучшения производительности (например, по дате или региону) ▪ Шардирование: Распределение данных между несколькими серверами для масштабирования ▪ Сжатие данных: Уменьшение объема хранимых данных для экономии места ▪ Репликация: Создание копий данных на нескольких узлах для обеспечения отказоустойчивости ▪ Резервное копирование: Автоматическое или ручное создание бэкапов данных ▪ Восстановление данных: Возможность восстановления данных после сбоев или удаления ▪ Кэширование: Хранение часто запрашиваемых данных в памяти для ускорения доступа ▪ Масштабируемость: Горизонтальное (добавление новых серверов) и вертикальное (увеличение мощности серверов) масштабирование ▪ Снимки (Snapshots): Создание моментальных снимков данных для резервного копирования и восстановления ▪ Аутентификация и авторизация: Контроль доступа к данным на основе ролей и прав пользователей ▪ Аудит: Логирование всех операций с данными для отслеживания изменений и доступа ▪ Маскирование данных: Сокрытие конфиденциальной информации (например, PII) от несанкционированного доступа ▪ Поддержка объектного хранилища S3: Возможность хранения данных в формате объектов (файлы, изображения, видео и т.д.) ▪ Автоматическое перемещение данных: Перемещение данных между классами хранения (например, из S3 Standard в S3 Glacier для архивного хранения) ▪ Удаление данных S3: Автоматическое удаление данных S3 по истечении срока хранения ▪ Поддержка протоколов: Поддержка протоколов S3 API, HTTP/HTTPS ▪ Аудит доступа: Отслеживание доступа к данным S3 и изменений ▪ Мониторинг производительности S3: Отслеживание использования ресурсов хранения ▪ Аналитика данных S3: Анализ использования данных S3 для оптимизации хранилищ

4. Обработка данных

▪ API: Предоставление интерфейсов для интеграции с другими системами ▪ Поддержка стандартов: Совместимость с SQL, ODBC, JDBC и другими стандартами ▪ Поддержка сложных запросов: Возможность выполнения аналитических запросов (OLAP) ▪ Обработка в реальном времени: Поддержка потоковой обработки данных (например, Apache Kafka,) ▪ Машинное обучение: Интеграция с ML-фреймворками ▪ Фильтрация: Выборка данных по определенным критериям (например, SQL-запросы с условием WHERE) ▪ Аналитические запросы: Поддержка сложных аналитических операций, таких как вычисление скользящих средних, трендов и прогнозов ▪ Статистическая обработка: Вычисление статистических показателей (дисперсия, корреляция, регрессия) ▪ Потоковая обработка: Возможность обработки данных в реальном времени (например, Apache Kafka, Apache Flink) ▪ Распределенная обработка: Использование кластеров для обработки больших объемов данных (например, Apache Hadoop, Spark) ▪ Параллельные вычисления: Выполнение задач на нескольких узлах одновременно ▪ Обработка неструктурированных данных: Работа с текстами, изображениями, видео и другими неструктурированными форматами ▪ Поддержка многомерных моделей данных ▪ Поддержка операций OLAP ▪ Инструменты повышения производительности в интересах OLTP (Оптимизация, Индексация, Кэширование) ▪ Поддержка ACID-свойств транзакций: атомарности (Atomicity), согласованности (Consistency), изолированности (Isolation) и долговечности (Durability) ▪ Горизонтальное масштабирование: Возможность добавления новых узлов для обработки растущего объема транзакций ▪ Вертикальное масштабирование: Увеличение ресурсов (например, CPU, RAM) на существующих узлах

5. Транспортировка и передача данных

▪ Извлечение данных из источников (например, базы данных, API, файлы) ▪ Преобразование данных (очистка, стандартизация, обогащение) ▪ Загрузка данных в целевые системы (например, хранилища данных, озера данных) ▪ Репликация данных (Data Replication): Создание копий данных в реальном времени или по расписанию ▪ Потоковая передача данных (Data Streaming), обработка данных в реальном времени ▪ Управление API: Создание, публикация и управление API для передачи данных ▪ Управление очередями сообщений (Message Queues) ▪ Мониторинг платформы данных ▪ Отслеживание использования CPU, памяти, дискового пространства и сетевых ресурсов ▪ Мониторинг нагрузки на серверы и узлы кластера ▪ Состояние кластера: Отслеживание состояния узлов в распределенных системах (например, в Hadoop, Kubernetes)

6. Личный кабинет (централизованное управление платформой)

▪ Загрузка данных: Возможность загружать данные из файлов (CSV, JSON, XML) или через API ▪ Выгрузка данных: Экспорт данных в различных форматах для анализа или интеграции с другими системами ▪ Уведомления: Оповещения о проблемах с качеством данных ▪ Поиск данных: Возможность поиска данных по метаданным (например, название таблицы, описание) ▪ Описание данных: Просмотр и редактирование метаданных (например, описание таблиц, атрибутов) ▪ Происхождение и история данных (Data Lineage) ▪ Визуализация: Графическое отображение происхождения и преобразования данных ▪ Назначение ролей: Управление правами доступа на основе ролей (например, администратор, аналитик)

7. Поддержка исполнения компонент платформы в контейнерное среде

▪ Развертывание и исполнение платформы в контейнерном кластере или многоконтейнерной среде ▪ Kubernetes ▪ K3S ▪ Docker Compose

8. Поддержка развертывания и исполнения

▪ Централизованное и распределенное развертывание конфигураций платформы ▪ Возможность развертывания и исполнения в гетерогенной (разные OC для разных узлов и компонент) вычислительной среде и среде хранения данных

9. Масштабируемость, доступность и отказоустойчивость

▪ Горизонтальное масштабирование за счёт управления экземплярами сервисов и узлов ▪ Вертикальное масштабирования за счёт использования аппаратных ресурсов ▪ Механизмы сохранения / восстановления платформы, настроек и данных интеграционных взаимодействий ▪ Балансировка входящей запросной нагрузки ▪ Определение и управление лимитами ресурсов

10. Поддержка аппаратных и программных кластерных конфигураций

▪ Кластера Active-Standby ▪ Кластера Active-Active

11. Журналирование и аудит

▪ Системное журналирование ▪ Построения графа фактического прохождения данных поданным журналов ▪ Ведение журнала изменения конфигураций приложения (процессы обработки, интеграционные процессы, объекты данных, коннекторы) ▪ Ведение и возможность настройки силами системного администратора журнала аудита действий пользователей ▪ Ведение журнала авторизации пользователей системы ▪ Встроенная защита журналов регистрации событий системы от несанкционированного уничтожения, модификации, подмены ▪ Возможность настройки различных уровней логирования ▪ Доступ или попытка доступа к ограниченному действию, объекту или отчету ▪ Несанкционированный доступ к данным

12. Пользовательский интерфейс, формы и поиск

▪ Наличие графического редактора для настройки экранных форм для конечных пользователей, реализованного в соответствии с low-code подходом ▪ Поиск по контенту данных ▪ Поиск по объектам и разделам системы

13. Аутентификация

▪ Аутентификация и авторизация пользователей (конечных пользователей, системных администраторов, разработчиков) осуществляется по принципу единого входа (Single Sign-On)

14. Поддержка протоколов аутентификации:

▪ SAML 2.0 ▪ SSL ▪ OpenID Connect (OIDC) ▪ Kerberos

15. Поддержка типов аутентификации:

▪ Аутентификация на основании логина и пароля, хранящегося в приложении ▪ Аутентификация с помощью токена ▪ Поддержка механизма использования доменной аутентификации и ролей LDAP ▪ Поддержка механизма использования доменной аутентификации и ролей keycloak

16. Использование гибкой ролевой модели (RBAC, ABAC) и возможность разграничивать права доступа:

▪ Для разработчиков интеграционных взаимодействий — по потокам и узлам интеграционных взаимодействий, настройкам компонент, инструментам разработки и тестирования ▪ Для администраторов интеграционной платформы — для системных и конфигурационных настроек, функции управления узлов и компонентов ▪ Для операторов и бизнес-пользователей, включая доступ к истории, отчетам, контенту и функциям обработке (пересылке) передаваемых данных и сообщений ▪ Для процессов исполнения и коннекторов —к вычислительным ресурсам и к внешним системам

17. Шифрование и безопасность

▪ Шифрование хранящихся данных ▪ Шифрование конфигураций и настроек ▪ Симметричное шифрование ▪ Асимметричное шифрование ▪ Хэширование ▪ Обеспечение и соблюдение отраслевых правил и норм безопасности

18. Технологический стек и совместимость с импортонезависимым системным ПО

▪ Соответствие текущим требованиям регулятора для включения в перечень отечественного ПО (работа на отечественных или импортонезависимых СУБД либо мультиплатформенность (работа с импортными, импортонезависимыми,отечественными ОС, СУБД)) ▪ Соответствие текущим рекомендациям регулятора (работа на отечественных и импортонезависимых ОС и использование отечественной или импортонезависимой среды разработки)

19. Количество реализованных проектов внедрения платформы 20. Количество проектов миграции 21. Количество сотрудников компании, занятых в разработке и развитии продукта 22. Количество сотрудников компании, занятых в службе поддержки 23. Поддержка

▪ Наличие более 1-й линии техподдержки ▪ Сообщество (в соцсетях и т.п.) для разработчиков,поддерживаемое вендором ▪ Руководства (администратора, пользователя) размещены в открытом доступе

24. Лицензирование

▪ Модель OnPremise (на локальных серверах) ▪ Разворачивание платформы в частном облаке ▪ Гибридный формат (OnPremise и Cloud) ▪ Наличие бессрочных лицензий