Разделы

Цифровизация Бизнес-приложения

ABBYY выпустила первый сервер

ABBYY выпустила свой первый серверный OCR-продукт. Доходы от его продаж, по прогнозам разработчиков, через год составят 10% от оборота компании.
Российская компания ABBYY выпустила новый продукт — Recognition Server — серверное решение для автоматизации процессов распознавания графических изображений символов. ABBYY Recognition Server может быть использован как самостоятельное решение, либо составная часть для серверного и клиент-серверного решения по автоматизации документооборота и архивирования на корпоративном рынке.

"Два года назад мы поняли, что есть свободная ниша на рынке между коробочными продуктами для распознавания изображений символов и девелоперскими решениями, — говорит Александр Рылов, главный менеджер по технологическим продуктам ABBYY. — Не хватало серверного решения. Разработчики СЭД создавали такие продукты — но либо «на коленке», либо слишком узкоспециализированные". ABBYY Recognition Server, по словам разработчиков, хорошо вписывается в модель «сервер плюс тонкие клиенты», позволяя тем самым снизить затраты ресурсов на управление программными средствами и обучение персонала. «Мы планируем, что доходы от продаж первой версии Recognition Server составят до 10% от оборота ABBYY через год после выхода продукта», — утверждают представители компании.

ABBYY Recognition Server предназначен для решения следующих задач: преобразование больших объемов документов; ввод документов для последующего индексирования; полнотекстовое преобразование для ввода данных; создание архива документов в формате PDF.

Возможна организация распознавания документов как фонового процесса, исполняемого на нескольких выделенных станциях распознавания. ABBYY Recognition Server имеет специальный режим анализа документа (DA для полнотекстового индексирования). В этом режиме выполняется автоматический поиск и распознавание всего текста, присутствующего на изображении, в том числе на картинках, в диаграммах, подписях, логотипах. Полученный таким образом массив данных может быть проиндексирован для поиска в системе электронного документооборота или электронного архива. Новый продукт можно использовать как модуль, осуществляющий полнотекстовое распознавание неструктурированных документов. Предусмотрена его интеграция в существующую систему ввода документов в качестве основного или дополнительного технологического ядра распознавания. С помощью ABBYY Recognition Server можно конвертировать документы в файлы формата PDF. Таким образом, в частности, может быть создан компактный электронный архив с возможностью полнотекстового поиска по каждому документу.

ABBYY Recognition Server состоит из 4 составных частей. Серверная часть управляет всеми сервисами, запросами и настройками обработки; открытый интерфейс программирования даёт возможность реализовать независимую клиентскую часть для использования продукта, и интегрировать его с другими приложениями; станция обработки предназначена для распознавания изображений отсканированных или сфотографированных документов, а также для преобразования PDF-файлов; консоль управления обеспечивает общий интерфейс администрирования для настройки и мониторинга работы. В зависимости от требований проекта возможна как локальная установка, при которой все компоненты устанавливаются на один компьютер, так и сетевая. При сетевой инсталляции каждая компонента устанавливается на отдельный компьютер в локальной сети.

Входящая папка с изображениями, которые необходимо обработать, может находиться на данном компьютере, в локальной сети или на FTP-сервере. Входящая папка может быть либо указана пользователем, либо выбрана из предопределённого списка. Изображения могут быть размещены во входящей папке любым пользователем, имеющим право доступа к ней. Исходящая папка содержит результаты обработки заданий, в том числе папку исключений, которая содержит XML-результат и изображения, обработка которых прошла некорректно или была прервана. Распознанный документ может быть одновременно сохранен в нескольких различных форматах.

Система поддерживает 187 языков для распознавания печатного текста на основе латинского, греческого, армянского и кириллического алфавитов. Реализовано распознавание многоязычных документов и различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.

Государство и бизнес делят ИИ на зоны ответственности
Импортонезависимость

При обработке PDF-файлов ABBYY Recognition Server определяет наличие и целостность текстового слоя. Реализовано преобразование изображений в файлы формата PDF с возможностью полнотекстового поиска, поддерживается создание PDF-файлов с тэгами. Имеется возможность сохранения в создаваемых PDF-файлах различных метаданных: закладок, гиперссылок, кросс-ссылок и т.п. Поддержаны алгоритмы шифрования и средства разграничения доступа: сохранение результатов распознавания в виде PDF-файла, защищённого паролем.

В серверном продукте реализовано распознавание одномерных и двумерных штрих-кодов. Автоматически идентифицируются и распознаются штрих-коды, расположенные на документе под любым углом по отношению к горизонтали.

Доступна установка порога качества распознавания изображений. Порог задаётся в виде предельно допустимого количества неуверенно распознанных символов на одной странице. Возможно планирование обработки заданий, то есть настройка очерёдности, включая назначение приоритетов, времени (день, месяц, час), частоты вызовов (например, раз в день). Возможно ранжирование заданий путём установки соответствующих приоритетов.

8 задач, чтобы перезапустить инженерную школу в России
импортонезависимость

Сервер работает на машинах под управлением Microsoft Windows Server 2003, Windows XP, Windows 2000. В следующую версию Recognition Server планируется добавить поддержку протокола SOA.

Стоимость продукта — от $2,5 тыс. за «вечную» лицензию с ограниченным количеством обрабатываемых страниц в месяц (25 тыс.).