Спецпроекты

На страницу обзора
Как превратить рутину обработки документов в источник ценных инсайтов

Технологии распознавания текста предварительно оцифрованных документов, в том числе изображений и фотографий, хорошо известны на российском рынке. Современные OCR способны распознавать символы с почти 100% точностью и успешно справляются с шаблонной обработкой типовых документов. Следующий этап развития рынка связан с внедрением IDP-платформ, подразумевающих интеллектуальную обработку документов на основе ИИ.

От OCR к IDP

Исторически так сложилось, что технологии распознавания символов в России основываются на разработках именно отечественных ученых. Среди самых первых примеров промышленного использования OCR можно назвать машинную обработку писем с индексами (цифры, заполненные от руки, но прямыми линиями по утвержденному образцу), применяемую в СССР еще с конца 60-х годов. А первая отечественная коммерческая технология распознавания текста появилась в более 30 лет назад.

В настоящий момент можно говорить о том, что на рынке существует достаточное число решений (в том числе и условно-бесплатных), которые успешно справляются с классической задачей оцифровки типового документа — перевести записи на бумаги в машиночитаемую форму. Дальнейшее развитие OCR-технологий идет по пути улучшения качества распознавания сложночитаемых символов, например написанных от руки, либо на ветхих поверхностях (или и то и другое одновременно).

Рейтинг вендоров OCR- и IDP-платформ 2025

Подробнее: обзор систем распознавания и анализа данных 2025

Функциональность
Универсальность
Разработка и поддержка
Проекты>10 млн руб. (2024 г.)
317
214
39
10
320
201
43
6
315
212
36
315
214
21
3
315
194
37
5
262
189
40
12
229
200
37
249
185
25
5
177
148
54
106
187
29
1

Ключевые игроки российского (равно как и мирового) рынка сосредоточились на развитии так называемых IDP-платформ, предназначенных для интеллектуальной обработки документов, цель которых обеспечить классификацию, проверку и автоматическую маршрутизацию оцифрованных данных. Причем технология предназначена не только для обработки типовых (шаблонных) документов (например, счетов-фактур), но также и для обработки неструктурированных данных, таких как договоры, накладные, заявления и т.п. Расширяется и само понятие обработки, так, современные интеллектуальные системы уже способны выполнять операции сверки на предмет соответствия корпоративному стилю или оригинал-макету (для изображений), выверять юридические формулировки и работать с цифровой маркировкой (например QR-кодами).

Разумеется, развитие IDP-систем основывается на использовании технологий ИИ. Для распознавания текста, анализа изображений и обработки неструктурированных данных используются технологии глубокого обучения, для анализа оцифрованного материала применяются большие языковые модели (LLM и NLP-модели). Мы иногда сталкиваемся с тем, что применение ИИ-инструментов отстает (иногда весьма существенно) от примеров из мирового опыта, тем более отрадно отметить, что российские программные OCR и IDP-решения хорошо адаптированы под стандарты, язык и существующие шаблоны документов. Ведущие игроки рынка выросли из российской практики и уже имеют и готовые интеграции с распространенным корпоративным ПО (СЭД, HRM, ERP и др.), и ценовую политику, ориентированную на реальные ИТ-бюджеты отечественных предприятий.

С другой стороны, западные санкции не единственная причина переходить на российские разработки. Как отмечает директор по развитию бизнеса ITFB EasyDoc Вадим Петросян, у иностранных моделей, помимо возможных утечек данных, есть и проблема плохой работы с кириллицей.

Отраслевая специфика OCR и IDP-решений

Игроки рынка единодушны во мнении, что ключевым рынком для внедрения OCR-технологий является финансовый сектор. В первую очередь, речь идет о розничных банках и страховых организациях, ориентированных на работу с физическими лицами. Именно эти компании обеспечивают постоянный спрос на оцифровку документов и обработку структурированных данных (паспорта, ИНН и т.п.). Причем вклад данного сегмента будет только увеличиваться, так как решения для интеллектуальной автоматизации (IDP) также весьма востребованы в этой отрасли. Среди важнейших кейсов применения технологий распознавания, стоит упомянуть обработку кредитных документов (договора, отчеты) и анализ неструктурированных данных для продукта «кредитный конвейер» — сбор информации о платежеспособности клиента из разных источников.

Следующим, не менее важным (а для некоторых вендоров и системообразующим) потребителем являются государственные организации и ведомства. Подавляющая часть госструктур регулярно работает (в той или иной форме) с обращениями граждан и юридических лиц, что предполагает огромные трудозатраты как на классический документооборот (выдача лицензий, обработка налоговых деклараций и т.п.), так и на работу с трудноформализуемыми документами (заявления, обращения, жалобы и т.п.) По данным экспертов, на текущий момент многие федеральные структуры уже подключили ИИ-инструменты для обработки документов. В первую очередь речь идет о классификации и маршрутизации стандартизируемых (то есть заполняемых по шаблону) входящих запросов, другим важнейшим драйвером выступает необходимость цифровизации неформализованных обращений. Именно на данном участке эффективность внедрения IDP-платформ может достигнуть максимальных значений за счет значительного ускорения времени отклика.

Ключевым рынком для внедрения OCR-технологий является финансовый сектор

К числу отраслей с растущим спросом относятся ретейл и транспортные компании. По роду деятельности здесь регулярно формируются значимые объемы документации — накладные, счета-фактуры, кадровые документы (особенно актуально для структур с федеральной сетью), а также иные финансовые и юридические документы. Причем в ряде случаев цифровизация уже является обязательной в нормативном порядке (например, электронные транспортные накладные).

Помимо документооборота технологии распознавания могут быть полезны на складе, один из кейсов внедрения — периодическое сканирование меток контейнеров или штрих-кодов палет для актуализации данных о товарных остатках.

Демократизация цен на ИИ-инструменты подтолкнет спрос со стороны компаний малого и среднего бизнеса. Здесь речь идет о задачах перевода в электронный вид специфических документов, таких как проектно-конструкторская документация, судебные протоколы или медицинские выписки (например, компьютерные томограммы, рентгеновские снимки).

Еще одним важным направлением может стать организация электронного архива организации.

По данным собственного исследования ITFB платформу EasyDoc преимущественно внедряли компании из сферы финансов и бухгалтерии, юриспруденции, логистики. А к числу перспективных отраслей следует отнести направление оцифровки исторических архивов и библиотек.

Проблемы и риски

С точки зрения заказчика, использование ИИ-инструментов для создания и развития собственной IDP-платформы возможно либо с опорой на собственные усилия, либо с привлечением вендора. Для обработки комплексной (или мультимодальной) информации, включающей в себя помимо текста и изображения также и аудио, и видео целесообразно использовать генеративные ИИ-модели (GenAI), которые не нуждаются в заранее подготовленных наборах данных для обучения (т.к. подготовка таких наборов под силу только действительно крупным компаниям).

Однако, создание генеративной ИИ-модели потребует весьма существенных инвестиций в инфраструктуру и наличия высококвалифицированной ИТ-команды. Решением, может выступать использование GPUaaS от российских облачных провайдеров, многие из которых уже имеют готовую платформу для выполнения генеративных рабочих нагрузок ИИ.

Альтернативой создания собственной модели, может стать обращение к разработчику OCR, здесь необходимо заранее выявить продукты, уже использующие продвинутые алгоритмы обработки и мы надеемся что обзор систем распознавания и анализа данных ключевых игроков рынка поможет вам в выборе.

Помимо этого, также следует учесть что по сложившейся практике дообучение и развитие ИИ-решений для обработки документов обычно осуществляется силами вендора, что, в свою очередь, налагает определенные требования к уровню развития партнера — достигнутые обороты, архитектурные и функциональные особенности платформы.

Среди рисков для IDP-разработчиков одним из важнейших является выбор стратегии развития и позиционирования — на текущем этапе задачи, решаемые платформой для интеллектуальной обработки документов в значительной степени перекрываются функциональностью RPA, BPMS и BI-систем. Что, в свою очередь, приводит к росту конкуренции не только с классическими игроками, но и с компаниями-лидерами рынка соответствующих решений. Уже сегодня лидирующие позиции вендоров с мировым именем (например Abbyy или Kofax) отнюдь не очевидны, причем на их место приходят амбициозные и высокоинициативные стартапы.

Тренды рынка систем распознавания и IDP-платформ

По мнению Вадима Петросяна, темпы роста российского рынка IDP будут выше мировых во многом благодаря импортозамещению и цифровизации — бизнесу и госсектору нужны точное распознавание, поддержка многоязычности и локальное развертывание. Ключевые драйверы — рост объёмов данных, регуляторные требования и потребность в скорости обработки.

Также в числе факторов, определяющих развитие OCR-систем и IDP-платформ, следует назвать расширение использования ИИ-моделей в системах распознавания.

«Современные системы OCR/IDP эволюционируют от базового распознавания текста к анализу контекста, классификации документов и обработке неструктурированных данных. ИИ учится на исторических данных и адаптируется к новым форматам», — отмечает генеральный директор компании «Биорг» Руслан Алигаджиев.

При этом Руслан Алигаджиев отнюдь не разделяет уверенности в безальтернативности генеративного ИИ: «По-прежнему остается проблема в наличии качественных массивов данных, подготовленных для обучения нейросети, то есть размеченных. Синтетическими данными вопрос на должном уровне удается решить не всегда».

Применение ИИ-моделей не является самоцелью, возможности использования передовой технологии необходимы в первую очередь для создания новой ценности для клиента. К решениям, обеспечивающим приведение документа в машиночитаемый вид уже все привыкли, тогда как от лидеров рынка ждут комплексных решений. Как метко заметил Руслан Алигаджиев, разница между результатами работы обычных систем распознавания и законченным IDP-решением — такая же, как между сырой нефтью и высококачественным бензином.

К числу возможностей, открываемых применением ИИ, относится расширение форматов данных для оцифровки. Мало какая компания опирается исключительно на .docx, многие работают с pdf-документами, html-страницами, электронными (а иногда и просто рукописными) письмами, не говоря уже об аудио и видео. «Будущее — за мультимодальной обработкой документов, и вендоры активно работают в этом направлении. Такая функциональность может быть реализована с помощью мультимодальных языковых моделей, например, VLM, которые существенно упрощают извлечение и обработку данных из различных форматов», — указывает Иван Волков, директор по продуктам Content AI.

К другим важным тенденциям Иван Волков относит расширение интеграционных возможностей: «IDP-системы будут все больше интегрироваться с другими корпоративными системами: RPA, CRM, ERP, HRM. Будущее интеллектуальной обработки документов будет характеризоваться способностью объединять несколько технологий для решения широкого спектра бизнес-задач». С этим согласен и Константин Артемьев, генеральный директор Sherpa Robotics. «Возможности IDP-платформы будут раскрываться в интеграции с RPA-платформами для end-to-end автоматизации», — подчеркивает он.

Реализация потребности в автоматизации обработки неструктурированных и мультимодальных данных должна привести OCR/IDP-рынок, по мнению Руслана Алигаджиева к новому формату: «Рынок движется в сторону гибридных решений, где ИИ, облачные технологии on-premise-компоненты объединяют для обработки сложных документов. Это не только повышает точность, но и создает основу для цифровой трансформации бизнеса».

Причем увеличение функциональных возможностей IDP-платформ совсем необязательно ведет к увеличению стоимости продукта. Наоборот, как уверен Константин Овчинников, директор по продукту Розумсофт, мы увидим рост доступности систем для малого и микро бизнеса за счет снижения стоимости. Об этом же говорит и Руслана Алигаджиев: «Гибридное решение, то есть интеграция с «облаком», позволит сократить затраты на бэк-офис до 40–60%. Облачные решения автоматизации цепочки задач, например, от сканирования счета до его оплаты, обеспечивают масштабируемость и доступность, что особенно критично для компаний с географически распределенными офисами».

37-я международная выставка информационных и коммуникационных технологий Связь-2025 37-я международная выставка информационных и коммуникационных технологий Связь-2025

erid: 2W5zFHRYEHv

Рекламодатель: АКЦИОНЕРНОЕ ОБЩЕСТВО «ЭКСПОЦЕНТР»

ИНН/ОГРН: 7718033809/1027700167153