Abbyy выпустила первые решения на основе технологии, которую разрабатывала 19 лет

Интеграция Бизнес-приложения
мобильная версия
, Текст: Мария Коломыченко
Первые решения на базе технологии интеллектуального анализа текстов Abbyy Compreno позволяют осуществлять интеллектуальный поиск и выявлять «сущности» в текстах.

Российская компания Abbyy выпустила первые продукты для корпоративного поиска и извлечения данных на базе технологии понимания, анализа и перевода текстов Compreno. Исследования и разработки в данной области велись Abbyy на протяжении 19 лет, а собственные инвестиции компании в это направление за все время работы составили более $80 млн.

Compreno представляет собой технологию синтаксического и семантического анализа текста, которая опирается на универсальную для всех языков иерархию понятий и модель отношений между этими понятиями, говорят в Abbyy. В основе Compreno лежит универсальное дерево семантических понятий, которое обеспечивает понимание и анализ текстов на основе их смыслов, а не просто визуального представления.

Первое решение на базе новой технологии получило название Abbyy Intelligent Search. Оно предназначено для поиска в корпоративных системах и предоставляет результаты поиска с высокой релевантностью, поскольку учитывает не только все формы слов, но и их значения, смысловые связи между словами, расстояние между словами в искомой фразе и контекст употребления, рассказали CNews в Abbyy.

Важной особенностью смыслового анализа документов является тот факт, что в результатах поиска есть возможность фильтровать слова по их значениям. Пользователь может выбрать, хочет ли он найти среди документов, например, слово «fire» в значении «стрелять», «поджигать» или «увольнять».

Второе из представленных решений, Abbyy Intelligent Tagger, автоматически находит в текстах так называемые «сущности» (названия организаций, персон, гео-объекты, даты и денежные суммы) и размещает их в метаданных документа. В результате, информацию в корпоративных хранилищах можно классифицировать, сортировать или фильтровать по какому-либо признаку.

«Используя выявленные сущности, можно качественно улучшить целый ряд организационных процессов, связанных с анализом содержимого и ключевых параметров документов. Например, повысить приоритет обработки документов, поступающих от самых важных клиентов, создать правила для автоматического сбора сведений о клиенте или партнере, оптимизировать маршрутизацию документа по определенным критериям бизнес-процессов, упростить очистку документов от персональных и конфиденциальных данных», — говорят в Abbyy.

Сергей Андреев планирует, что через 3 года Abbyy сделает направление Compreno окупаемым
Сергей Андреев планирует, что через 3 года Abbyy сделает направление Compreno окупаемым

Оба решения в настоящий момент поддерживают английский и русский языки. В будущем разработчик планирует добавить в продукты поддержку немецкого, испанского, французского и китайского языков.

Помимо интеллектуального поиска и извлечения «сущностей» в корпоративных хранилищах, Abbyy считает важным направлением работы e-discovery — процесс поиска информации в документах компаний в рамках юридических разбирательств, аудита и расследований в США и Великобритании.

«Скорость сотрудничества компании, участвующей в судебном процессе, и полнота предоставления информации зачастую являются ключевыми факторами для присяжных и судьи, которые позволяют им оценить участие компании в процессе», — считает гендиректор Abbyy Сергей Андреев. При этом в компании не исключают возможности в дальнейшем применять продукты на основе Compreno в юридических спорах и на территории России.

«Наша индустрия нуждается в аналитике и более интеллектуальных решениях поиска, — говорит Атле Шеккеланд (Atle Skjekkeland), вице-президент и главный операционный директор Ассоциации по вопросам управления информацией и изображениями (AIIM). — Люди часто используют самые разнообразные термины для обозначения одних и тех же понятий, а потому необходимы решения, которые работают не только со значением слов, но и с контекстом. Кроме того, люди, которые находятся в поиске информации, часто не до конца понимают, что именно они ищут – им приходится перебирать варианты. И не найдя искомую информацию со 2-3 раза, они просто сдаются».

Abbyy Intelligent Search
Интерфейс демо-версии Abbyy Intelligent Search

На данный момент у Abbyy запущено около 15 пилотных проектов, в которых применяются решения на базе Compreno. В основном, партнерами компании стали зарубежные компании, которые работают в сфере Document Management, в частности некоторые разработчики ECM-систем. По мнению Андреева, они могут помочь уже имеющимся у себя клиентам «получить новый уровень впечатлений от работы с поиском».

«На американском рынке фокус, в первую очередь, будет сделан на ISV-разработчиках (Independent Software Vendor; Независимый поставщик программного обеспечения – прим.CNews) разных решений. На некоторых других рынках, в том числе российском, мы будем пробовать поставлять наши решения в качестве законченного продукта», — рассказал Андреев.

В компании отмечают, что на начальном этапе разработки Compreno основным сценарием ее использования считали онлайн-перевод. Однако конкурировать с бесплатными решениями для массового рынка (например, онлайн-переводчиком от Google) сейчас не является первым приоритетом для Abbyy — оплачиваемый спрос лежит больше в сегментах поиска и анализа информации в корпоративных хранилищах.

Не собирается компания выходить и на рынок веб-поиска, где, опять-таки, пришлось бы конкурировать с Google, «Яндекс» и другими успешными поисковыми системами. «Задача поиска в интернете на сегодняшний день решена довольно неплохо во многом благодаря модели краудсорсинга. То есть выдача, которую делают современные поисковые системы в интернете, базируется на ранжировании, обеспеченном «кликами» людей, уже просматривавших данные страницы. Выходить в сферу веб-поиска нам не кажется целесообразным», — говорит Сергей Андреев.

Ежегодно Abbyy вкладывает в разработки на основе Compreno более $15 млн. C данным проектом компания стала одним из первых резидентов «Сколково», получив от фонда в 2011 г. около $14 млн. По словам Сергея Андреева, сейчас перед Abbyy стоит задача вывести направление Compreno на тот уровень, «когда оно перестанет тратить деньги». Добиться этого планируется в ближайшие 3 года.

Представленные продукты – лишь первые примеры решений на базе технологии Compreno. В дальнейшем Abbyy планирует сосредоточиться на направлениях многоязычного поиска, письменного перевода с одного языка на другой и анализа тональности высказываний в текстах.