Разделы

Интернет Бизнес Интеграция ИТ в госсекторе Инвестиции и M&A

«Дочка» «Ростеха» приобретает разработчика технологий анализа больших данных

«Ростех» в лице «Объединенной приборостроительной корпорации» планирует приобрести компанию «Авикомп Сервисез», разработчика семантического процессора для мониторинга и анализа больших массивов данных, включая документы, написанные естественным языком.

«Объединенная приборостроительная корпорация» (ОПК), принадлежащая госкорпорации «Ростех», собирается приобрести и «включить в свой контур управления» отечественного разработчика семантических технологий «Авикомп Сервисез». Об этом CNews рассказал директор департамента инновационного развития ОПК Александр Калинин. В «Авикомп Сервисез» подтвердили наличие такого плана.

Приобретение, по словам представителя ОПК, может произойти на безденежной основе: за контрольный пакет акций «Авикомп Сервисез» получит доступ к заказам, которые исполняют предприятия «Ростеха».

Владельцами ЗАО «Авикомп Сервисез» являются основатели компании, генеральным директором - Виктор Клинцов, также работающий директором российского офиса консорциума W3C.

Выручка «Авикомп Сервисез» по данным Росстата в 2013 г. составила 423 млн руб., сократившись по сравнению с 2012 г. на 43%. Чистая прибыль упала с 40,2 млн руб. в 2012 г. до 6,7 млн руб. в 2013 г.

Основная разработка «Авикомп Сервисез» - это лингвистический процессор Ontosminer для построения сложных систем текстового мониторинга и анализа данных.

Ontosminer, разработку которого «Авикомп Сервисез» вела с 2001 г., основан на анализе семантики текста, или, как говорят сами разработчики, осуществляет поиск и анализ необходимых сведений «не по ключевым словам, а по смыслу документа».

В качестве одного из компонентов Ontosminer включает NoSQL-СУБД OntoQuad, также разработанную «Авикомп Сервисез».

Одна из самых впечатляющих возможностей Ontosminer - это распознавание слов на языках, которым система не обучалась. Так, например, после анализа большого числа текстовых документов на русском языке, например, о китайских персоналиях (в демонстрации, проведенной представителями «Авикомп Сервисез» для CNews, использовались тексты о Сун Цинлин, супруге китайского революционера Сунь Ятсена), система начинает распознавать иероглифическое начертание их имен. Это объясняется тем, что у имен в иероглифическом начертании система обнаруживает такие же семантические связи, как у имен, записанных на кириллице или латинице.

Пример работы семантического процессора Ontosminer с публикациями в Сети



Самое очевидное применение Ontosminer - анализ и систематизация больших массивов переписки, корпоративных документов и новостных публикаций в интересах госорганов. В одном из федеральных ведомств, где внедрена система, она занимается автоматизированным анализом и классификацией входящей корреспонденции (более 1 тыс. обращений в день по тысяче категорий).

Сами разработчики одной из важнейших киллер-фич своей системы называют возможность ее настройки самим заказчиком. Как говорит представитель «Авикомп Сервисез» Андрей Гвоздев, в отличие от традиционных систем поиска и мониторинга Ontosminer позволяет осуществлять тонкую настройку лингвистического процессора самому заказчику под свои цели с помощью технологий машинного обучения (machine learning). На основе введенных пользователем текстовых примеров система обучается пониманию смысла отдельных слов и целых текстов по заданной тематике.

Как увеличить инвестиции в ИТ-инсорсинг в полтора раза
ИТ в банках

Представители «Авикомп Сервисез» говорят, что система способна анализировать семантическую структуру любого вида данных. В перспективе на ее принципах могут быть созданы системы для анализа изображений и звука, а также для управления домашними устройствами («умный дом»).

На сайте госзакупок можно найти крупные контракты «Авикомп Сервисез» с МВД, столичными ФОМС и ИТ-департаментом.

По заказу МВД «Авикомп Сервисез» в течение нескольких лет развивает систему поиска и обработки информации. Она применяется в органах управления разведки внутренних войск МВД для мониторинга СМИ, блогов и соцсетей, и позволяет извлекать из текстов «объекты внимания на основе лингвистических правил», например, анализировать упоминание персон, политических партий и движений.

Для московского ДИТ «Авикомп Сервисез» разрабатывал единый регистр пациентов медучреждений, для ФОМС – развивал аппаратно-программный комплекс автоматизированной информационной системы обязательного медицинского страхования Москвы.

Облачные хранилища получили трехуровневую защиту от вымогателей
Облака

«Авикомп Сервисез» поставляла свои разработки для семантической обработки информации не только российским госведомствам, но и в страны ближнего зарубежья, а также в РИА «Новости», говорят ее представители. За границей семантические решения внедряются через родственную компанию «Эвентос».

«Объединенная приборостроительная корпорация» называет «Авикомп Сервисез» ключевым партнером и считает разработку прорывом в области создания отечественных платформ анализа больших данных (Big Data).

Корпорация намерена внедрять лингвистический процессор в проектах, связанных с построением сложных аналитических систем и систем мониторинга для широкого круга заказчиков. Кроме того, технологии компании перспективны для проектов в области СУБД и интеграции разноформатных информационных хранилищ.

Костяк компании «Авикомп Cервисез», в которой работают 60-70 человек, составляют сотрудники Высшей школы экономики. Ее проректор Андрей Жулин говорит, что технология создавалась при непосредственном участии ВШЭ и ее сотрудников - математиков и лингвистов.

С апреля 2015 г. «Авикомп Cервисез» и ОПК желающие могут получить доступ к Ontosminer для исследовательских целей, для чего им нужно заполнить регистрационную форму. Отправка заявки не гарантирует непременного получения доступа системе, заявки рассматриваются в индивидуальном порядке.

Владислав Мещеряков

Подписаться на новости Короткая ссылка