Спецпроекты

Как и чем наполнить ECM

Документооборот
Преимущества ECM-систем для бизнеса очевидны – это систематизация и упорядочивание работы с документами, прозрачность и скорость их обработки. Только есть одно "но": ECM прекрасно работает с электронными документами, а физический мир все еще предпочитает бумагу.

Чтобы информационные системы заработали, нужно снабдить их "топливом" в виде документов. Задача вовсе не тривиальная, если посмотреть на нее внимательно: загрузка документов в ECM – это сложный технологический процесс, состоящий из разных фаз и операций и от того, насколько он грамотно реализован, зависит продуктивность работы в целом.

Функции ввода документов (document capture) занимают одно из первых мест в типовой архитектуре ECM – все начинается с загрузки документов в систему. На российском рынке в области комплексных услуг по наполнению электронных архивов лидирует корпорация ЭЛАР, обладающая более чем 20-летним опытом выполнения объемных и сложных проектов национального масштаба. В ходе их реализации было переведено в электронный вид около полумиллиарда бумажных и микрографических документов.

Путь от бумаги к цифре

На первый взгляд все просто: берем документ, сканируем и помещаем его в систему, снабжая регистрационной карточкой. Но бес, как всегда, в деталях: чем выше качество сканирования, тем ниже скорость и больше объем файлов. С другой стороны, слишком низкое разрешение ведет к росту числа ошибок распознавания. С черно-белыми документами проще работать, но они хуже воспринимаются человеком. И не забудьте еще о том, что документы бывают сшитыми, ветхими, рукописными, слепыми – напечатанными под копирку, когда текста почти не видно. Нужно принимать решение по каждому такому вопросу, чтобы выстроить процесс оцифровки бумажных документов и, конечно, заказчику едва ли стоит идти здесь опытным путем – пространство для экспериментов слишком велико.

Методологически верным было бы определить до начала сканирования, какие данные нужно из документов извлечь, какая точность необходима и являются ли они конфиденциальными. Тогда можно спроектировать технологический участок ввода документов наиболее оптимальным способом, подобрать сканеры и рассчитать число операторов.

Перевод документа в цифровой вид не ограничивается только созданием его «фотографии», технологическая цепочка включает операции улучшения и очистки изображения, контроль качества, OCR и преобразования изображений в заданный формат для хранения, например, в PDF. Обычное ПО, поставляемое в комплекте со сканером для таких задач не подходит. В проектах ЭЛАР для этой цели используются профессиональные системы управления массовым вводом, обладающие более мощным функционалом и позволяющие организовать коллективную работу множества операторов.В общем, оцифровка документов – это не ИТ в чистом виде, где почти все стало виртуальным. Физический мир в полной мере дает о себе знать в проектах по вводу документов – нужно доставлять документы к сканеру, извлекать скрепки, увозить документы обратно... В общем, это целый производственный участок, где есть станки, рабочие и материалы. Только готовая продукция создается в цифровом виде.

Индексировать и распознать

Документы сканируют для того, чтобы извлечь из них индексную информацию, которую затем используют в бизнес-процессе и для последующего поиска самих документов. В некоторых случаях исходный документ даже и не обязательно хранить – когда идет обработка различных анкет, например. В этом случае извлеченные данные поступают в базу, а образ можно удалить. Но чаще всего приходится решать задачу наполнения ECM, когда в систему передается образ документа, индексная информация для заполнения карточки и распознанный текст. Последнее не является обязательным и не для всех документов распознавание сработает. Однако же наличие полного текста документа значительно обогащает возможности поиска.

Несмотря на то, что технология извлечения данных из образов документов является зрелой и представлена на рынке более 20 лет, каждый проект требует индивидуального подхода. Например, во время оцифровки архива актовых записей ЗАГС по Стравропольскому Краю, специалисты ЭЛАР столкнулись с тем, что бланк записи о рождении с 1918 г. менялся 15 раз, а данные были одни и те же.

Когда нужно ввести в систему персональные данные или даже секретные документы, необходимо ограничить осведомленность операторов о полном содержании этих документов. Но как может человек вводить данные, не видя документа, из которого их следует взять? Специализированное ПО для управления процессом индексирования, применяемое в проектах ЭЛАР, позволяет разделить изображение на отдельные фрагменты: каждый оператор вводит только часть данных, не видя всего изображения. Например, один вводит только имя, другой – фамилию, а третий – дату рождения. Таким образом, на рабочем месте не происходит никакой обработки персональных данных, вся эта информация сводится воедино только внутри системы. Для полей, где требуется высокая гарантия точности, применяется двойной ввод данных, когда два оператора независимо друг от друга вводят или верифицируют значение одного и того же поля, например, ИНН. Если оба ввели его одинаково, то вероятность, что это значение является правильным, близка к 100%. Эта функция тоже реализуется управляющим ПО.

Иногда индексирование нельзя даже начать, пока не проведена предварительная работа по составлению или очистке данных справочников, используемых для верификации индексных данных. Так, при наполнении образами и индексной информацией электронного архива Министерства имущества Самарской области заказчиком была поставлена задача разделить строку адреса на составляющие: субъект РФ, район, населенный пункт, улица, номер дома. Оказалось, что в документах встречаются адреса и местоположения земельных участков, не попадающие под классификацию согласно КЛАДР (классификатор адресов России). Специалистам ЭЛАР для разделения адреса пришлось сформировать справочники на основании фактически имеющихся в документах сведений.

Чем важен комплексный подход

Когда стартует проект по переходу на электронный документооборот, каждый заказчик встает перед дилеммой: полагаться на собственные силы или поручить все специализированной фирме? Встречается еще промежуточный вариант, когда закупается техника и ПО, а для выполнения ввода данных нанимают низкоквалифицированный персонал, чтобы сэкономить бюджет. Недооценка сложности работы и отсутствие опыта управления проектами по массовому вводу часто приводит к тому, что работу приходится переделывать – этот риск достаточно велик.

Первый подход, когда заказчик делает все сам, показывает крайне низкую скорость внесения данных и значительное повышение нагрузки на сотрудников, так как требует отвлечения их от основной работы или работ во внеурочное время. Так, в одном из регионов сотрудники ЗАГС за год работы смогли внести только 5% от востребованных записей.

Второй подход (с привлечением временного персонала) позволяет получить электронный фонд пользования и избавиться от необходимости обращения к бумажному архиву, но имеет несколько сложностей. Во-первых, для получения качественных читаемых электронных копий необходима закупка дорогостоящего сканирующего оборудования. Во-вторых, привлекаемые к внесению сведений в информационную систему внешние исполнители редко обладают необходимыми знаниями. Контроль при подобной схеме практически невозможен. Это приводит к ошибкам в данных, внесенных в информационные системы, что недопустимо.

Наиболее практичным оказывается в этом случае полный аутсорсинг, что исключает повышение нагрузки на сотрудников заказчика, позволяет производить контроль загружаемых в систему данных и реализовывать проект максимально оперативно.

Зачем нужен залповый ввод

Такой военный термин – "залповый" довольно точно описывает ситуацию. Если у компании накопился бумажный архив за многие десятилетия и есть потребность перейти к "цифре", то пробить брешь в традиционных способах работы, ориентированных на бумажные документы, можно только при помощи массированного применения тяжелой техники, сконцентрировав ее на узком участке фронта внедрения информационных технологий.

Создание информационной системы электронного архива требует внушительных инвестиций, и поэтому важно обеспечить ее быстрое наполнение документами, чтобы пользователи начали активно в ней работать. Такой проект должен быть выполнен в очень короткие сроки и требует очень четкой организации. Излишне говорить, что привлечение специализированной компании абсолютно необходимо.

После того, как основной массив накопленных данных будет обработан, следует позаботится и о вводе новых поступлений – ведь архивы имеют свойство пополняться ежегодно, если мы говорим о деловых документах, а не об исторических фондах. Для участка текущего ввода требуется значительно меньшая производительность. К тому же, за время осуществления залпового ввода сотрудники заказчика часто приобретают знания и опыт, достаточные для того, чтобы справляться с текущим вводом самостоятельно.

С электронным архивом госуслуги заработали быстрее

На бытовом уровне мы воспринимаем архив как некое тихое место, куда редко кто заходит, а электронный архив – просто как хранилище файлов, собранных там на всякий случай. К повседневной работе, на первый взгляд, архив никакого отношения не имеет. Однако жизнь нам доказывает обратное: по опыту, например, Министерства имущественных отношений Самарской области, существенный поток наследственных и других гражданских дел требует получения копий правоустанавливающих документов, в т.ч. решений о приватизации, о предоставлении земельных участков в пожизненное наследуемое владение, о передаче в аренду и т. д. Со стороны юрлиц существенный поток обращений за выдачей копий архивных документов связан с делами о приватизации имущества и приказами министерства по основному виду деятельности.

Реализация проекта электронного архива позволила ускорить процесс предоставления государственных услуг благодаря улучшению документационного обеспечения сотрудников министерства при выполнении должностных обязанностей. Система обеспечила сотрудников удобным и быстрым доступом к документам, устранила простои, связанные с ожиданием физической доставки документа из архива, с ожиданием документа ввиду невозможности одновременной работы нескольких сотрудников с единственным бумажным носителем.

Работа с электронным архивом снижает трудозатраты на физическое перемещение документов, на копирование документов, на поиск документов, необходимых для принятия решения по управлению и распоряжению имуществом или для оказания государственных услуг, в том числе по предоставлению копий и выписок. В результате скорость оказания госуслуг значительно возросла.

Это очень важный момент: при реализации электронных госуслуг обязательно нужно рассматривать весь процесс их оказания в целом, а не сосредотачиваться только на приеме обращений через сайт. Крайне важно обеспечить информационную поддержку внутренних процессов в органах власти, и электронный архив является весьма значимым звеном, влияющим на скорость отработки запросов.

Пункт назначения – электронный архив

Теперь несколько слов о конечном пункте назначения электронных документов – месте, где они будут храниться постоянно или до истечения установленного срока. В качестве платформы для создания электронного архива специалисты ЭЛАР рекомендуют использовать типовое программное обеспечение "Саперион", сертифицированное ФСТЭК по 4 уровню контроля отсутствия НДВ (НДВ-4) и разрешенное к применению в АС до класса защищенности 1Г включительно.

Архив прежде всего обеспечивает сохранность электронных документов. В "Саперион" это достигается за счет хранения документов в контейнерах собственного формата и встроенных алгоритмов технического кодирования контента (поддержка стандартов Blowfish, DSA, RSA, RC2, RC4, RC5 и др.) без установки специализированного ПО. Система регламентации прав доступа позволяет установить разные возможности ознакомления с информацией для разных категорий пользователей, как на документ целиком, так и на отдельные его атрибуты.

Разумеется, "Саперион" может быть адаптирован под специфические функциональные требования, возникающие в различных проектах. Например, для проекта в Самаре было разработано специализированное ПО для ведения электронного архива приватизационных дел, дел с приказами и решениями по основному виду деятельности министерства имущества области, чтобы пользователи архива оперировали привычными им понятиями из своей предметной области, а не тратили свое время на изучение сложной многофункциональной системы.

Кстати, электронный архив не всегда будет финальным этапом в жизненном цикле документа. Потребность в создании электронного архива возникает когда документов очень много и есть строгие регулирующие требования по их хранению. На самом деле задача наполнения информационных систем данными из бумажных документов имеет более универсальный характер. Услуги по оцифровке бумажных документов востребованы в проектах по проведению социологических опросов, маркетинговых исследований, подсчету результатов голосования, загрузке данных в разные учетные системы – ERP, CRM и т. д. Во всех этих случаях нужна отлаженная технология и опытная команда, готовая выполнить проект в срок и предложить заказчику оптимальный путь к достижению результата.

Станислав Макаров


Профиль месяца

Мы помогаем выращивать российское ПО

Андрей Филатов

глава SAP CIS

Взгляд месяца

На хайпе часто можно построить только фейк

Сергей Мацоцкий

основатель и член совета директоров IBS