Разделы

Цифровизация Бизнес-приложения Документооборот

Cognitive Technologies выпустила новый продукт для обработки бизнес-документов

Компания Cognitive Technologies объявила о выходе нового программного продукта для сканирования, сжатия и отправки документов по электронной почте — Compressimo. Программа рассчитана на массового пользователя.

По словам разработчиков, Compressimo предназначен для обработки широкого класса бизнес-документов (накладные, таблицы, факсы, договоры, деловые письма, счета, и т.д.), доля которых в отечественном документообороте составляет более 90%. Compressimo способен распознавать, где в документе находится основной контент, а где вспомогательный, таким образом, исключая возможность потери полезных данных при обработке таких элементов изображения, как рецензии, подписи, печати, распоряжения и т.д.

Использование Compressimo позволяет автоматизировать процесс сканирования и обработки документов и получать компактные и одновременно качественные оцифрованные документы, пригодные как для полнотекстового поиска по их содержимому, так и для долговременного хранения. Благодаря Compressimo пользователь может получать более высокое качество содержательных разделов документа, чем на бумажном оригинале, говорится в сообщении Cognitive Technologies.

Как рассказали в компании, ее создание стало возможно благодаря новым алгоритмам анализа и обработки изображений, разработка которых стала очередным этапом в решении задачи понимания документов. В Compressimo реализован некий аналог экспертной системы — система сама умеет «понимать» тип и структуру документа и автоматически подбирает наиболее подходящий режим обработки. После удаления искажений и помех изображение автоматически разделяется на слои (текст, иллюстрации, печати, подписи и т.п.). При этом система сама принимает разумное решение — выбирает для каждого слоя свой, оптимальный алгоритм сжатия. В Compressimo предусмотрена возможность распознавания текста на 23 языках при помощи встроенного и доработанного ядра OCR-системы CuneiForm (OpenOCR).

После обработки и сжатия все слои (включая слой с распознанным текстом) собираются в одностраничный или многостраничный файл в формате PDF/A (стандарт для долговременного хранения документов ISO 19005-1:2005). По данным Cognitive Technologies, данный подход позволяет снизить объем оцифрованных документов в среднем до 20 раз. Например, одна страница накладной ТОРГ-12 или счета-фактуры при сохранении в формате JPEG (разрешение 300 dpi, цветной режим сканирования, jpeg-компрессия отключена) будет в среднем иметь объем файла 2,42 МБ. Сжатие того же документа с помощью Compressimo даст файл объемом 96 КБ при аналогичном (в некоторых случаях и более лучшем) качестве результата.

Compressimo базируется на технологии Cognitive PDF/A. На разработку этой технологии разработчиками было затрачено три года (около 45 тыс. человеко-часов).

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

«Мировой рынок продуктов, подобных Compressimo, еще не сформирован. При многообразии программ, предлагающих пользователю конвертацию скан-копии в PDF/A документ, большинство разработчиков либо не приводит в полное соответствие стандарту ISO результирующий PDF/A документ, либо стараются своим продуктом угодить как обычному, так и «продвинутому» пользователю, — отметили в Cognitive Technologies. — Compressimo же спроектирован таким образом, что все возможные и действительно необходимые пользователю операции производятся нажатием не более двух-трех клавиш. Результирующий PDF/A документ, созданный в Compressimo, полностью соответствует стандарту ISO 19005-1:2005».

По мнению президента Cognitive Technologies Ольги Усковой, «по предварительным оценкам объем мирового рынка таких продуктов уже в ближайшие два-три года может составить до $20 млрд, а его российский сегмент — до $1 млрд; востребованность таких программ в мире чрезвычайно велика».

Как с помощью ad-hoc инструмента снизить расходы на внедрение аналитики
Импортонезависимость

В разработку Compressimo разработчиками было вложено порядка €6 млн (из них €5 млн на разработку технологии Cognitive PDF/A и €1 млн непосредственно на Compressimo), сообщили Cognitive Technologies. До конца года на продвижение продукта компания планирует выделить порядка $2 млн. По информации компании, сейчас в стадии подписания находятся порядка 10 крупных контрактов, в том числе с государственной структурой по регистрации брокеров (Stockbroker) в единой государственной системе в одной из стран Латинской Америки, а также с Национальной почтовой службой одной из европейских стран. В настоящее время по всему миру систему скачивают порядка 5 тыс. раз в сутки. Разработчики планируют выйти на число 200 в сутки до конца августа.

Стоимость Compressimo составляет 799 руб. за одно рабочее место на российском рынке и €20 для зарубежного рынка.

Татьяна Короткова