Разделы

Цифровизация Внедрения Документооборот

Технологии ABBYY помогают оцифровать культурное наследие Европы

Компания ABBYY, мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявила результаты своего участия в международном проекте IMPACT (Improving Access to Text, «улучшая доступ к тексту») — масштабном мероприятии, инициированном Европейской комиссией для преобразования европейского печатного наследия в цифровые ресурсы и объединяющем 26 организаций, среди которых национальные и региональные европейские библиотеки, научно-исследовательские институты и технологические партнеры.

ABBYY участвует в проекте с 2008 г., программное обеспечение компании используется для оптического распознавания текста документов (Optical Character Recognition — OCR), набранных старинными шрифтами. В процессе работы с важными историческими материалами из коллекции ведущих европейских библиотек специалисты компании оптимизировали технологии предварительной обработки и анализа структуры документов. Это позволило добиться более точного распознавания символов, говорится в сообщении ABBYY. Многие новые разработки в области распознавания специализированных текстов и документов уже нашли применение в продуктах ABBYY FineReader Engine и ABBYY Recognition Server 3.0. Обновленные решения компании теперь доступны для использования организациями во всем мире.

В рамках IMPACT в тесном сотрудничестве с участниками других организаций специалисты ABBYY решают технологические задачи, характерные для таких крупномасштабных проектов, как оцифровка библиотечных фондов. Благодаря этому взаимодействию национальные библиотеки получают возможность преобразовывать оригиналы старинных документов в электронный вид, осуществлять в цифровых копиях поиск по тексту, а также создавать на различных языках мира собственные электронные словари.

«Раньше нам не всегда удавалось качественно распознать текст или преобразовать данные в формат XML, особенно когда приходилось работать со старинными книгами, журналами и газетами, — отметил Али Конте (Aly Conteh), член исполнительного совета проекта IMPACT, руководитель программы Британской национальной библиотеки по преобразованию печатных текстов в цифровой формат. — Участие в IMPACT открыло нам доступ к передовым технологиям распознавания, в том числе предоставляемым компанией ABBYY. Эти решения позволили нам и другим участникам проекта эффективно обрабатывать документы, качество которых ранее оставляло желать лучшего».

CNews подготовил инфографику по одной из крупнейших информационных систем России
Цифровизация

«Оцифровка печатного интеллектуального наследия Европы не только помогает сохранить его для будущих поколений. Так мы сможем открыть доступ к этому информационному массиву для миллионов исследователей, студентов и простых читателей по всему миру, — объяснил Андрей Исаев, директор департамента технологических продуктов ABBYY. — Это благородная цель, и мы рады возможности принимать в этом участие совместно с другими организациями, воодушевленными этой идеей».

Отметим, что продукты и технологии ABBYY также применяются и в крупнейших библиотеках России. Так, в Российской государственной библиотеке (РГБ) оцифрован архив Высшей аттестационной комиссии Минобразования РФ. в Государственной публичной научно-технической библиотеке России (ГПНТБ России) с помощью ABBYY стал электронным каталог карточек. В научной педагогической библиотеке им. К.Д. Ушинского (НПБ им. К. Д. Ушинского), крупнейшей отраслевой библиотеки России по педагогике и психологии, технологии ABBYY помогли оцифровать авторефераты и реализовать полнотекстовый поиск по ним.

Татьяна Короткова