НТЦ ИРМ и "Пирит": новые технологии для автоматизации документооборота
НТЦ ИРМ подписал соглашение о сотрудничестве с компанией ”Пирит” (26 место в рейтинге CNews100), согласно которому заказчикам при внедрении автоматизированной системы документационного обеспечения управления DIS: class (электронная канцелярия “Золушка”) будут поставляться программно-аппаратные решения, предназначенные для организации промышленного ввода печатных документов, представленных на бумажных носителях.Программно-аппаратное решение поточного ввода документов реализовано на сканерах семейства Fujitsu с применением при обработке документов технологии ABBYY FineReader 6.0.
В офисе компании НТЦ ИРМ специалистами обеих компаний при поддержке ABBYY SoftWare House создан демонстрационный стенд, позволяющий демонстрировать потенциальным заказчикам технологию поточного ввода документов в составе автоматизированной системы документационного обеспечения управления.
С помощью комплекса поточного ввода осуществляется весь цикл обработки печатных документов:
- сканирование изображений документов, группировка их в пакеты и регистрация в системе;
- распознавание и разбиение зарегистрированного пакета на наборы страниц, соответствующие одному многостраничному документу;
- идентификация документа в соответствии с информацией, хранящейся в библиотеке документов DIS: class, и, при необходимости, проверка наличия заявленного количества страниц;
- удаление, при необходимости, пустых листов;
- верификация результатов распознавания;
- экспорт электронных документов, включая, индексный файл, многостраничное изображение документа в формате TIF и структурированный документ в формате RTF;
- администрирование и мониторинг работы программно-аппаратного комплекса ввода.
Перед началом поточного ввода документы проходят предварительную обработку и регистрацию в DIS:class. В базу данных DIS:class заносится запись по каждому документу, содержащая его атрибуты. Одним из атрибутов является уникальное значение штрих-кода, который наклеивается на первую страницу документа, либо печатается на странице-разделителе, которая предваряет документ. Этот номер используется для связи полученного из бумажного документа электронного образа и записи в базе данных DIS: class, соответствующей этому документу. Разделенные штрих-кодами документы укладываются в удобные для сканирования пачки и отправляются для обработки программно-аппаратным комплексом поточного ввода документов.

Программно-аппаратный комплекс поточного ввода работает полностью автоматическом режиме. Обработка пакетов происходит в рабочей папке на файл-сервере. В результате полной обработки пачки документов пользователь получает набор фалов многостраничных изображений документов, их текстовых образов и индексную информацию о связи записей документов в DIS:class с полными путями к файлам электронных документов через идентификатор – уникальное значение штрих-кода. Для экспорта электронных документов непосредственно в DIS:class могут быть использованы готовые и разработаны новые модули экспорта.
Работы по организации поточного ввода документов могут выполняться на отдельных программных модулях (станциях), которые устанавливаются на необходимое количество компьютеров для достижения заданной производительности.
Источник: по материалам компании НТЦ ИРМ.