Разделы

Цифровизация Бизнес-приложения

ABBYY Fine Reader Engine: теперь и для Linux

Компания ABBYY объявляет о начале продаж в России системы ABBYY FineReader Engine – инструментария разработчика, позволяющего встроить систему оптического распознавания текстов в любое ПО. FineReader Engine будет доступен сразу для двух платформ: для Windows предлагается новая версия ABBYY FineReader Engine 7.0, для Linux впервые выпущена версия ABBYY FineReader Engine 6.0.

Дополнительно доступно большое количество модулей, включая экспорт в PDF и XML, распознавание рукописного текста, меток, двумерных штрих-кодов, распознавание китайского и японского языков. Модуль FineReader XIX позволяет осуществлять распознавание староевропейских документов на пяти европейских языках (английский, немецкий, французский, испанский, итальянский) с фрактурными шрифтами прошлого столетия, популярными в Германии и Испании.

FineReader Engine имеет две специальные технологии, направленные на решение задачи, связанной с распознаванием документов с текстом, напечатанным поверх картинки, с цветным текстом на цветном фоне, с низкой контрастностью: адаптивная бинаризация (преобразование исходного изображения в черно-белое) и интеллектуальные алгоритмы фильтрации текстур. Интеллектуальные алгоритмы фильтрации текстур позволяют эффективно отделять текст от фона в процессе бинаризации. Метод адаптивной бинаризации позволяет на каждом фрагменте изображения размером в слово подбирать индивидуальные параметры яркости.

Система ABBYY FineReader поддерживает распознавание символов, написанных шрифтами OCR-A, OCR-B и MICR (E13B), которые часто используются на различных финансовых документах, паспортах, кредитных карточках.

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

Помимо этого, ABBYY FineReader Engine обладает следующими особенностями:

  • Режим ускоренного распознавания специально разработан для потокового ввода документов, где точность распознавания не играет основной роли. В этом режиме скорость ввода в среднем возрастает в 2-2,5 раза.
  • Сохранение исходного оформления документа при передаче результатов распознавания в форматы RTF, PDF и HTML.
  • Автоматическое определение ориентации страницы, расположения текстовых блоков, таблиц и картинок, а также ориентации вертикального текста в таблицах.
  • Возможность манипулирования/редактирования блоков (удаление)
  • Сохранение результатов распознавания во множество форматов для Windows: RTF, PDF, XML, HTML, PPT, XLS, TXT, CSV и DBF; для LINUX: RTF, PDF, HTML, TXT и CSV.
  • Различные режимы и уровни сохранения форматирования от «простого текста» без какого-либо форматирования до полного сохранения форматирования, включая таблицы, абзацы, разбиение на колонки, сохранение типов и начертаний шрифта, обрамлений и т.д.

    ABBYY предлагает гибкую систему лицензирования: для разработчиков и для использования/распространения. Цена лицензии на комплект для разработчика фиксированная – $4500 для Windows и $9000 для Linux. Цена на дополнительный комплект распознавания китайского и японского языков – $2200. Цены на лицензии для использования/распространения полностью зависят от сложности проекта, объема предполагаемой обрабатываемой документации и могут варьироваться от нескольких долларов до нескольких десятков тысяч долларов.

    Источник: по материалам компании ABBYY.