Интеллектуальная обработка документов с помощью «Элар Контекст»
Корпорация «Элар», обладающая более чем 30-летним опытом в области цифровизации документооборота и автоматизации архивных процессов, расширяет возможности модуля распознавания документов в составе ЕСМ-платформы «Элар Контекст» с помощью генеративного ИИ. Об этом CNews сообщили представители «Элар»
В рамках развития российской ЕСМ-платформы (Enterprise Content Management - система управления корпоративным контентом) «Элар Контекст» специалисты корпорации начали активно внедрять модули на основе искусственного интеллекта для распознавания документов. Этому способствовал еще один вид деятельности компании. Помимо разработки программного обеспечения, компания «Элар» является подрядчиком, оказывающим услуги по оцифровке архивных документов, среди реализованных проектов известные во всем мире ресурсы – Память Народа, Национальная электронная библиотека. Таким образом накоплены огромные компетенции по обработке различных документов, классификации и распознаванию широкого видового состава архивных материалов и содержащейся в них информации. По мере реализации проектов формировался уникальный датасет, послуживший основой для обучения системы искусственного интеллекта. Следующей ступенью стало использование генеративного искусственного интеллекта, в котором специалисты компании увидели большой потенциал для решения задач анализа и обработки документов.
На сегодняшний день, с учетом обучения с использованием эксклюзивного датасета, компания является держателем одной из самых мощных в стране моделей, «умеющей» работать с различными документами и данными. Результатом проведенной работы стал новый модуль для платформы «Элар Контекст», созданный на базе генеративного ИИ для автоматического распознавания и обработки документов различного качества и типа, в том числе произвольной структуры, позволяющий существенно снизить ручной труд и повысить скорость работы с большими объемами данных.
В первую очередь решение необходимо для автоматизации задач обработки поступающих в компанию документов и накопленных бумажных архивов. Модуль позволяет сократить ручной труд и количество ошибок при формировании электронного архива, а также обогатить корпоративные информационные системы проверенными и критически важными данными.
Сокращение рутинных операций при обработке документов позволяет ускорить и повысить эффективность выполнения производственных задач в рамках различных подразделений: бухгалтерии, отдела кадров, канцелярии, архива, инженерной службы и конструкторского бюро. При этом автоматизация обеспечивает оптимизацию трудовых ресурсов предприятия, позволяя распределять ценный человеческий потенциал на более значимые задачи.
Одной из важнейших особенностей модуля является его готовность к работе без сложной предварительной настройки. Решение способно распознавать документы без необходимости длительного обучения. В сложных случаях для повышения точности распознавания требуется небольшое обучение на основе реальных образцов документов заказчика (выборка из 150 документов). Специальный интерфейс администрирования позволяет сотрудникам без навыков программирования в режиме No-code быстро настраивать распознавание ключевых реквизитов, что снижает затраты времени на внедрение и обучение.
Ключевой показатель эффективности модуля — высокая точность распознавания. Основной метрикой точности распознавания является обработка документа, то есть всех полей в составе обрабатываемого документа. Когда все поля документа проходят установленный порог распознавания, только тогда документ считается правильно распознанным.
Средняя доля правильно распознанных документов составляет 81,7%.

При этом точность отдельных полей достигает впечатляющих 99%, что обеспечивает надежность и качество обработанной информации. Кроме того, модуль обладает возможностями горизонтального масштабирования, позволяя обрабатывать один документ менее чем за секунду даже при значительном росте объемов данных.
Усиление компетенций и внедрение новых решений в сфере автоматического распознавания данных — лишь один из этапов в развитии обширной экосистемы управления документами, которую развивает корпорация «Элар». Важную роль в этом процессе играют высококвалифицированные специалисты, обладающие глубокими знаниями в области искусственного интеллекта и машинного обучения. Их экспертиза позволяет обучать ИИ, адаптируя его к специфическим требованиям бизнеса и обеспечивая максимальную точность распознавания.
Следующим шагом становится хранение и организация данных, которое также обеспечивается в рамках интегрированной защищенной системы электронного архива на базе отечественной ECM-платформы «Элар Контекст». Система обеспечивает юридическую значимость, поиск и долговременное хранение документов, а также связку с профильными информационными системами.

Помимо этого, для организации полноценного конвейера работы с документами необходима и специализированная аппаратная база. В этой области «Элар» предлагает планетарные сканеры под марками «ЭларСкан» и «ПланСкан», которые позволяют оцифровывать как текущие, так и архивные бумажные документы.
В экосистему цифровых продуктов «Элар» также входит катастрофоустойчивое хранилище информации, реализуемое с помощью роботизированных электронных архивов на оптике «Эларобот НСМ», способных гарантировать неизменное хранение данных анные свыше 50 лет. Программно-аппаратные комплексы «Эларобот НСМ» включены в реестр Минпромторга России и в реестр ПАК Минцифры России.