05 Октября 2010 11:10 05 Окт 2010 11:10 |

Свободная OCR-система от Google поддерживает русский язык

Исходные тексты OCR-движка Tessaract был опубликован компанией HP в 2005 году. К тому времени проект уже 10 лет не развивался и сильно уступал своим конкурентам. Однако проект был “подхвачен” компанией Google, которая на днях объявила о выпуске третьей версии Tessaract.

Среди усовершенствований новой версии – новый модуль анализа оформления страниц, поддержка открытого стандарта представления OCR-информации hOCR, поддержка библиотеки leptonica для выполнения операций, связанных с обработкой изображений.

Однако главная новость для российских пользователей заключается в том, что Tessaract теперь поддерживает русский язык. До недавнего времени единственной свободной OCR-системой с поддержкой русского языка было ПО CuneiForm, открытое российским разработчиком Cognitive Technologies в 2008 году. Изначально CuneiForm был доступен только в версии для MS Windows, но сегодня уже существуют графические оболочки для использования CuneiForm из среды Linux (существуют графические оболочки Cuneiform-Qt и YAGF).

Инструкция по установке Tessaract в средах Windows и UNIX доступна на сайте проекта.

В каком ЦОД разместить оборудование Colocation? Найти ответ на ИТ-маркетплейсе Market.CNews

Егор Гребнев

Подписаться на новости

Короткая ссылка

Свободная OCR-система от Google поддерживает русский язык

Другие материалы рубрики

MARKET.CNEWS

CRM

ERP

S3-хранилище

Dedicated

Техника

На дачу и обратно: лучшие российские алкотестеры

Обзор смартфона HUAWEI nova 12i: внимание на камеру

Hisense Laser Mini Projector C1 — новый эталон домашнего кинотеатра

Наука

Российские ученые открыли удивительные грязевые вулканы на дне Байкала

Робот-медуза с электронным кардиостимулятором исследует океан и сообщает о находках

На дне российской шахты найдены уникальные термиты — они сохранились в янтаре возрастом 38 миллионов лет

Таких темпов роста нашей электронной отрасли
не было никогда

Администрировать нашу платформу
так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили
разработку программного кода

70% компаний, применяющих ИИ, подтверждают положительный эффект

Таких темпов роста нашей электронной отрасли не было никогда

Администрировать нашу платформу так же удобно, как Microsoft Exchange

Свободная OCR-система от Google поддерживает русский язык

Другие материалы рубрики

MARKET.CNEWS

CRM

ERP

S3-хранилище

Dedicated

Техника

На дачу и обратно: лучшие российские алкотестеры

Обзор смартфона HUAWEI nova 12i: внимание на камеру

Hisense Laser Mini Projector C1 — новый эталон домашнего кинотеатра

Наука

Российские ученые открыли удивительные грязевые вулканы на дне Байкала

Робот-медуза с электронным кардиостимулятором исследует океан и сообщает о находках

На дне российской шахты найдены уникальные термиты — они сохранились в янтаре возрастом 38 миллионов лет

Таких темпов роста нашей электронной отрасли не было никогда

Администрировать нашу платформу так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили разработку программного кода

70% компаний, применяющих ИИ, подтверждают положительный эффект

Таких темпов роста нашей электронной отрасли не было никогда

Администрировать нашу платформу так же удобно, как Microsoft Exchange

Таких темпов роста нашей электронной отрасли
не было никогда

Администрировать нашу платформу
так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили
разработку программного кода