«Дочка» «Ростеха» приобретает разработчика технологий анализа больших данных

Интернет Бизнес Интеграция ИТ в госсекторе Инвестиции и M&A
мобильная версия
, Текст: Владислав Мещеряков
«Ростех» в лице «Объединенной приборостроительной корпорации» планирует приобрести компанию «Авикомп Сервисез», разработчика семантического процессора для мониторинга и анализа больших массивов данных, включая документы, написанные естественным языком.

«Объединенная приборостроительная корпорация» (ОПК), принадлежащая госкорпорации «Ростех», собирается приобрести и «включить в свой контур управления» отечественного разработчика семантических технологий «Авикомп Сервисез». Об этом CNews рассказал директор департамента инновационного развития ОПК Александр Калинин. В «Авикомп Сервисез» подтвердили наличие такого плана.

Приобретение, по словам представителя ОПК, может произойти на безденежной основе: за контрольный пакет акций «Авикомп Сервисез» получит доступ к заказам, которые исполняют предприятия «Ростеха».

Владельцами ЗАО «Авикомп Сервисез» являются основатели компании, генеральным директором - Виктор Клинцов, также работающий директором российского офиса консорциума W3C.

Выручка «Авикомп Сервисез» по данным Росстата в 2013 г. составила 423 млн руб., сократившись по сравнению с 2012 г. на 43%. Чистая прибыль упала с 40,2 млн руб. в 2012 г. до 6,7 млн руб. в 2013 г.

Основная разработка «Авикомп Сервисез» - это лингвистический процессор Ontosminer для построения сложных систем текстового мониторинга и анализа данных.

Ontosminer, разработку которого «Авикомп Сервисез» вела с 2001 г., основан на анализе семантики текста, или, как говорят сами разработчики, осуществляет поиск и анализ необходимых сведений «не по ключевым словам, а по смыслу документа».

В качестве одного из компонентов Ontosminer включает NoSQL-СУБД OntoQuad, также разработанную «Авикомп Сервисез».

Одна из самых впечатляющих возможностей Ontosminer - это распознавание слов на языках, которым система не обучалась. Так, например, после анализа большого числа текстовых документов на русском языке, например, о китайских персоналиях (в демонстрации, проведенной представителями «Авикомп Сервисез» для CNews, использовались тексты о Сун Цинлин, супруге китайского революционера Сунь Ятсена), система начинает распознавать иероглифическое начертание их имен. Это объясняется тем, что у имен в иероглифическом начертании система обнаруживает такие же семантические связи, как у имен, записанных на кириллице или латинице.

Пример работы семантического процессора Ontosminer с публикациями в Сети



Самое очевидное применение Ontosminer - анализ и систематизация больших массивов переписки, корпоративных документов и новостных публикаций в интересах госорганов. В одном из федеральных ведомств, где внедрена система, она занимается автоматизированным анализом и классификацией входящей корреспонденции (более 1 тыс. обращений в день по тысяче категорий).

Сами разработчики одной из важнейших киллер-фич своей системы называют возможность ее настройки самим заказчиком. Как говорит представитель «Авикомп Сервисез» Андрей Гвоздев, в отличие от традиционных систем поиска и мониторинга Ontosminer позволяет осуществлять тонкую настройку лингвистического процессора самому заказчику под свои цели с помощью технологий машинного обучения (machine learning). На основе введенных пользователем текстовых примеров система обучается пониманию смысла отдельных слов и целых текстов по заданной тематике.

Представители «Авикомп Сервисез» говорят, что система способна анализировать семантическую структуру любого вида данных. В перспективе на ее принципах могут быть созданы системы для анализа изображений и звука, а также для управления домашними устройствами («умный дом»).

На сайте госзакупок можно найти крупные контракты «Авикомп Сервисез» с МВД, столичными ФОМС и ИТ-департаментом.

По заказу МВД «Авикомп Сервисез» в течение нескольких лет развивает систему поиска и обработки информации. Она применяется в органах управления разведки внутренних войск МВД для мониторинга СМИ, блогов и соцсетей, и позволяет извлекать из текстов «объекты внимания на основе лингвистических правил», например, анализировать упоминание персон, политических партий и движений.

Для московского ДИТ «Авикомп Сервисез» разрабатывал единый регистр пациентов медучреждений, для ФОМС – развивал аппаратно-программный комплекс автоматизированной информационной системы обязательного медицинского страхования Москвы.

«Авикомп Сервисез» поставляла свои разработки для семантической обработки информации не только российским госведомствам, но и в страны ближнего зарубежья, а также в РИА «Новости», говорят ее представители. За границей семантические решения внедряются через родственную компанию «Эвентос».

«Объединенная приборостроительная корпорация» называет «Авикомп Сервисез» ключевым партнером и считает разработку прорывом в области создания отечественных платформ анализа больших данных (Big Data).

Корпорация намерена внедрять лингвистический процессор в проектах, связанных с построением сложных аналитических систем и систем мониторинга для широкого круга заказчиков. Кроме того, технологии компании перспективны для проектов в области СУБД и интеграции разноформатных информационных хранилищ.

Костяк компании «Авикомп Cервисез», в которой работают 60-70 человек, составляют сотрудники Высшей школы экономики. Ее проректор Андрей Жулин говорит, что технология создавалась при непосредственном участии ВШЭ и ее сотрудников - математиков и лингвистов.

С апреля 2015 г. «Авикомп Cервисез» и ОПК желающие могут получить доступ к Ontosminer для исследовательских целей, для чего им нужно заполнить регистрационную форму. Отправка заявки не гарантирует непременного получения доступа системе, заявки рассматриваются в индивидуальном порядке.