Разделы

Цифровизация Импортонезависимость

Smart Engines представила OCR для распознавания текста на 102 языках со скоростью 15 страниц в секунду

Российская компания Smart Engines объявляет о выпуске системы распознавания текста нового поколения. Она умеет находить документ на фотографии или скане и распознавать все текстовые данные на 102 языках. Решение является частью продукта Smart Document Engine, включенного в реестр российских программ. Собственная технология распознавания символов GreenOCR, используемая во всех продуктах компании, позволяет достигать высочайшей точности даже на некачественных фотографиях. ПО предназначено для замещения продуктов ABBYY и созданных на их основе решений, предлагаемых в России, а также другого иностранного ПО в корпоративном и государственном секторе. Об этом CNews сообщили представители Smart Engines.

Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах. От скорости и точности извлечения данных напрямую зависит трудоемкость и возможная глубина автоматизации процесса обработки документов.

Разработанная система обеспечивает технологический суверенитет, так как в продукте для распознавания и обработки изображений не используется код Open Source и иностранные программные компоненты. На современном смартфоне весь процесс от фотографии до текста занимает три-четыре секунды, что делает планшетный сканер ненужным. Кроме распознавания система, автоматически обрезает, разглаживает сложенные документы и улучшает его изображение превращая телефон в мгновенный сканер. В серверных решениях на 32-ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.

«Ранее в подобных задачах многие компании полагались на OCR решения компании ABBYY, но в начале 2022 г. после 30 лет работы в стране она неожиданно покинула Россию, исключив ряд продуктов из реестра российских программ. Это событие стало “черным лебедем” для отечественного рынка, создав существенные риски при реализации проектов цифровой трансформации, - сказал генеральный директор Smart Engines Владимир Арлазаров. - Сейчас мы представили последний недостающий элемент и теперь в России есть все необходимые бизнесу технологии для распознавания документов».

Коробочное решение для ИИ можно развернуть за месяц вместо года
Коробочное решение для ИИ можно развернуть за месяц вместо года Цифровизация

Разработчикам и заказчикам технология распознавания текстовых документов доступна для встраивания в серверные, мобильные, десктопные и веб-приложения в составе программного продукта Smart Document Engine. Система функционирует без подключения к сторонним сервисам и внешним ресурсам, не требует GPU. Для распознавания не нужно наличие сети Интернет, все вычисления выполняются на центральном процессоре устройства и не требуют использования видеокарт.

Кроме привычных языков, базирующихся на кириллических и латинских алфавитах, распознает арабский, армянский, греческий, грузинский, иврит, китайский, корейский и японский. Smart Document Engine поддерживает ALT Linux, Astra Linux, «Ред ОС» и другие ОС семейства Linux, Windows, macOS, iOS, Android, ОС «Аврора».