Спецпроекты

На страницу обзора
Market.CNews опубликовал рейтинг систем распознавания и анализа данных класса OCR и IDP

ИТ-маркетплейс Market.CNews опубликовал рейтинг систем распознавания и анализа данных. Аналитики провели сравнение функциональных возможностей, оценили функциональные и архитектурные особенности OCR-платформ российских вендоров.

Market.CNews впервые на рынке подготовил сравнительный обзор возможностей отечественных разработчиков систем распознавания (OCR) и платформ интеллектуальной обработки документов (IDP).

Российский рынок OCR и IDP уверенно растет. Рост вызван как запросом на цифровизацию со стороны государственного сектора и ряда отраслей, так и существенным прогрессом технологий машинного обучения и искусственного интеллекта.

Очевидно, что из всех бизнес-процессов компании, документооборот является основным потребителем сервиса преобразования текста из документов и изображений в машиночитаемый формат. Технологии OCR, позволяющие автоматизировать рутинные процессы и значительно снизить влияние человеческого фактора, уже доказали свою эффективность в подразделениях, традиционно связанных с большим объемом бумажных документов — бухгалтерии, кадровых и юридических департаментах.

Развитие инструментов ИИ позволяет автоматизировать следующие этапы бизнес-процесса и перейти от извлечения и оцифровки текста к проверке, классификации и маршрутизации данных на основе анализа (IDP). Причем обработке уже подвергаются не только шаблонные формы документов, но и неструктурированная информация (например, договоры, заявления, письменные обращения и т.п.).

Результаты рейтинга

На основе данных, полученных в ходе подготовки рейтинга, аналитики Market.CNews подготовили диаграмму с оценками по сгруппированным параметрам, отражающим как функциональные характеристики, так и возможности вендора развивать и поддерживать программный продукт.

Рейтинг вендоров OCR- и IDP-платформ 2025

Подробнее: обзор систем распознавания и анализа данных 2025

Функциональность
Универсальность
Разработка и поддержка
Проекты>10 млн руб. (2024 г.)
317
214
39
10
320
201
43
6
315
212
36
315
214
21
3
315
194
37
5
262
189
40
12
229
200
37
249
185
25
5
177
148
54
106
187
29
1

Сравнение поставщиков проводилось по уникальной методике, разработанной аналитиками Market.CNews и учитывающей следующие критерии:

1. Функциональность:

  • Возможности графического пользовательского интерфейса
  • Возможности распознавания, классификации и извлечение данных
  • Проверки и сравнения
  • Возможности настроек пользовательского интерфейса
  • Реализация требований информационной безопасности

2. Универсальность:

  • Возможности импорта/экспорта
  • Ограничения прав использования
  • Политики лицензирования
  • Архитектурные особенности
  • Совместимость с инфраструктурой

3. Разработка и поддержка:

  • Срок гарантийной поддержки ПО
  • Стоимость технической поддержки в год
  • Количество партнеров в РФ с правом продажи лицензий
  • Количество партнеров в РФ с правом доработки продукта
  • Предоставление обновлений платформы и ее компонентов в рамках платной тех.поддержки
  • Наличие технической документации, необходимой для поддержки на стороне Заказчика своими силами
  • Количество дней в течение которых можно бесплатно тестировать полнофункциональную версию ПО

4. Количество реализованных проектов за 2024 г., стоимостью более ₽10 млн.

Российский рынок систем распознавания и интеллектуальной обработки документов уверенно растет

Для каждого параметра, входящего в состав критериев, разработана балльная система оценки. Участники рейтинга ранжируются по сумме набранных баллов: чем больше баллов, тем выше место. Подробности в разделе «Правила начисления баллов».

Топ-5 вендоров систем распознавания и анализа данных 2025

Место Компания Название системы Сумма баллов
1
ITFB Group
ITFB EasyDoc
580
2
Content AI
IDP-платформа ContentCapture
570
3
ELMA
ELMA365 CSP
563
4
SL Soft
SL Soft AI
553
5
Sherpa Robotics (Шерпа Роботикс)
Sherpa IDP
551

Источник: Market.CNews. Полная версия

Лидером рейтинга системы распознавания и анализа данных в 2025 г. по сумме набранных баллов стала интеллектуальная платформа EasyDoc компании ITFB. Система не только располагает широкими возможностями для предобработки, распознавания, классификации и верификации данных, но также имеет высокий уровень качества разработки и поддержки программного продукта.

На втором месте — IDP-платформа ContentCapture компании Content AI (создана бывшими сотрудниками Abbyy в России). Система набрала максимальное количество баллов по интегральному показателю «Функциональность». К числу других преимуществ компании следует отнести мощную партнерскую сеть и гибкую политику лицензирования.

Третье место, с очень незначительным отставанием от предыдущего игрока, занимает платформа управления контентом на базе low-code ELMA365 CSP.

Правила начисления баллов

Рейтинг построен по балльной системе. Каждому поставщику начислено определенное количество баллов по нескольким критериям. Чем выше итоговая сумма баллов, тем выше место в рейтинге.

Критерий Правило начисления баллов
1. Наличие графического пользовательского интерфейса для администрирования системы
2. Наличие графического пользовательского интерфейса для настройки процесса распознавания и бизнес-логики проверок
3. Обработка неструктурированных документов с извлечением данных на естественном языке
4. Приведение извлеченных данных к нужному формату
5. Распознавание сложных таблиц (двумерных, многомерных, с объединенными ячейками)
6. Возможность обрабатывать графические файлы (jpg, tiff, png, bmp и т.д.)
7. Сравнение значений распознанных атрибутов в разных документах (междокументарные проверки)
8. Проверка полноты комплекта обрабатываемых документов (комплектность)
9. Проверка наличия изменений в статичных данных документа
10. Настройка этапов процесса распознавания (импорт, предобработка, распознавание, классификация, постобработка, экспорт)
11. Конструктор процесса распознавания
12. Конфигурирование алгоритмов предобработки изображений
13. Настройка кросс документарных проверок по значениям атрибутов
14. Настройка комплектности
15. Настройка логики верификации
16. Возможность описания логики сложных проверок извлекаемых атрибутов с помощью скриптов
17. Осуществляется логирование доступа к данным
18. Возможность управления журналами аудита
19. Возможность настройки прав пользователей
20. Наличие функций мониторинга и отчетности по ключевым параметрам системы
21. Программное обеспечение входит в реестр российского ПО
22. Все компоненты российского производства или opensource
23. Наличие формата поставки On-premise
24. Наличие API с документацией
25. Реализована балансировка нагрузки
10 баллов за каждый пункт
1. Наличие графического пользовательского интерфейса для настройки моделей распознавания новых типов документов
2. Наличие графического пользовательского интерфейса для настройки моделей классификации документов
3. Автоматическое улучшение качества изображений
4. Возможности для горизонтального и вертикального масштабирования
5. Возможность внедрения и развертывания ПО силами заказчика
6. Наличие сквозной авторизации пользователей через внутренние системы предприятия
7. Имеется документация на все ключевые модули
8. Поддержка веб-браузеров Chrom, Яндекс-браузер
9. Поддержка Astra Linux\ RedOS\CentOS
10. Поддержка серверной части ОС Astra Linux Релиз "Орел" и "Смоленск"
11. Поддержка СУБД PostgreSQL Pro 11 и выше, MS SQL, Oracle
9 баллов за каждый пункт
1. Наличие графического пользовательского интерфейса для мониторинга и просмотров отчетов
2. Импорт из сетевых (горячих) папок корпоративной сети
3. Импорт из папок FTP/SFTP
4. Импорт/экспорт через API
5. Использование шаблонного распознавания для жестких форм и графически схожих документов
6. Классификация на основе текстовых признаков
7. Распознавание одномерных и двумерных штрих-кодов, QR-кодов
8. Извлечение данных из рукописного текста
9. Сравнение извлекаемых значений атрибутов со значениями из справочников
10. Управление справочниками/словарями
11. Решение не предполагает использование сторонних проприетарных плагинов и дополнительных компонентов для установки на устройствах заказчика
12. Платформа поддерживает работу мультифилиального предприятия
13. Все используемые модули open-source имеют лицензию позволяющую распространять их в коммерческих продуктах
8 баллов за каждый пункт
1. Использование моделей LLM для извлечения атрибутов
2. Извлечение данных на основе правил с использованием моделей NER, NLP
3. Возможность определения взаимосвязей в рамках документа/в рамках документов пакета
4. Возможно ограничить закупаемый функционал по типу документов (например, только для распознавания паспорта РФ)
5. Возможность закупки только ядра по распознаванию для встраивания в партнерские решения
6. Лицензирование по схеме «Бессрочная лицензия»
7. Отсутствуют ограничения по количеству пользователей и одновременно работающих пользователей
7 баллов за каждый пункт
1. Классификация на основе графических признаков
2. Лицензирование по схеме «Ежегодная подписка»
6 баллов за каждый пункт
1. Возможность обрабатывать текстовые файлы (docx, txt, rtf, xlsx и т.д.)
2. Возможность обрабатывать содержимое электронных писем c вложенными файлами (формат msg)
3. Наличие модуля сравнения разных версий документа
4. Право на изменение кода
5. Предоставление обновлений Платформы и ее компонентов в рамках платной тех.поддержки
6. Наличие технической документации, необходимой для поддержки на стороне Заказчика своими силами
5 баллов за каждый пункт
Лицензирование по схеме «Постраничная тарификация»
4 балла
1. Поставка как PaaS решение
2. Поставка как SaaS решение
3. Наличие мобильного клиента для просмотра и верификации распознавания
4. Политики лицензирования прочие
5. Совместимость с системным ПО прочая
3 балла за каждый пункт
Количество реализованных проектов за 2024 г., стоимостью более 10 млн руб.
По 1 баллу за каждый проект

Перейти к обзору «Cистемы распознавания и анализа данных класса OCR и IDP»

Обратную связь по рейтингу и обзору можно направить по электронной почте market@cnews.ru с пометкой OCR в теме письма.

37-я международная выставка информационных и коммуникационных технологий Связь-2025 37-я международная выставка информационных и коммуникационных технологий Связь-2025

erid: 2W5zFHRYEHv

Рекламодатель: АКЦИОНЕРНОЕ ОБЩЕСТВО «ЭКСПОЦЕНТР»

ИНН/ОГРН: 7718033809/1027700167153