«Ай-Теко» создала платформу для семантической обработки текстовой информации из соцмедиа

Интеграция Big Data Бизнес-приложения
мобильная версия
, Текст: Татьяна Короткова

Компания «Ай-Теко» объявила о запуске платформы «2Толк», создаваемой в рамках проекта инновационного центра «Сколково». Комплекс будет использоваться в системах аналитической разведки информационного пространства для исследования событий, проблем, информационных кампаний путем мониторинга интернет-ресурсов, сообщили CNews в «Ай-Теко».

Целью данной разработки стало предоставление аналитикам средств для быстрого выделения знаний из множества разнородных источников текста. Подобные исследования сейчас ведутся в активно развивающемся проекте Knowledge Discovery and Dissemination (KDD), DARPA. Предтечей нового продукта явились методы и технологии, реализованные «Ай-Теко» в системе «Аналитический курьер», рассказали в компании.

Создаваемые специалистами «Ай-Теко» облачные сервисы «2Толк» будут применяться для мониторинга веб-ресурсов, highload-обработки текста на нескольких языках, включающей анализ сущностей, их связей, мнений, тональности высказываний, социального графа авторов и сообществ. Программный компонент для хранения документов и знаний использует Open Source-платформы Big Data.

Среди особенностей проекта в компании отметили поддержку: управляемых данными гибких сценариев аналитической обработки результатов поиска, когнитивных карт, персональных рубрикаторов, конструкторов инфопанелей и отчетов (сценарий может включать последовательное применение методов Text & Data Mining к коллекциям документов, полученным на предыдущих этапах); персонализации поисковой выдачи с учетом профиля и истории работы пользователей; извлечения и представления знаний в открытых форматах; полного цикла обработки сообщений — от поиска в источниках и доставки до получения полезных результатов; онлайн-процессов семантического агрегирования всех сущностей до доминант синсетов в кластерных, когнитивных картах, частотных распределениях и рефератах (например, в частотном распределении будет выполняться объединение категорий из одного синсета (набора именований объекта) в одну категорию); обеспечения чувствительности всех результатов к изменениям в составе базы знаний в режиме Near real-time.

«Появление огромных объемов контента увеличивает спрос на “осмысление” естественного языка в системах поддержки принятия решений и мониторинга социальных медиа, в когнитивных приложениях. Для удовлетворения непрерывно растущих потребностей рынка нами было принято решение о создании на основе результатов внедрений “Аналитического курьера” нового продукта — программно-технологической платформы “2Толк” для семантической обработки больших объемов текстовой информации из соцсетей в инновационном центре “Сколково”, — рассказал Сергей Киселев, директор департамента систем управления знаниями компании «Ай-Теко». — Хочу отметить, что на базе сервисов “2Толк” предполагается разработка приложений для различных областей, а предоставление полученных с помощью комплекса знаний будет соответствовать открытым международным стандартам».