Brand Analytics представила технологию автоматического выявления объектов в потоках соцмедиа

Интеграция Бизнес-приложения Big Data
мобильная версия
, Текст: Татьяна Короткова

Компания Brand Analytics, игрок российского рынка анализа и мониторинга СМИ и социальных медиа, представила новый аналитический функционал NER — автоматическое выявление в информационном поле социальных медиа таких объектов, как персоны, компании и географические объекты. Ключевая особенность российской разработки — выявление неопределенных и новых объектов без необходимости использования быстро устаревающих словарей, сообщили CNews в Brand Analytics.

По словам разработчиков, NER — распознавание именованных сущностей — адресован PR-специалистам, маркетологам и аналитикам, контролирующим репутацию и другие метрики здоровья бренда, служа ответом на растущий интерес к автоматическому выявлению трендов информационного поля. Новые возможности реализованы в формате интерактивных отчетов, которые ускоряют анализ больших данных в режиме реального времени.

«Объекты и тренды информационного поля выявляет технология NER, разработанная лингвистической командой Brand Analytics для анализа данных социальных медиа. Именно такие данные являются наиболее интересными для анализа трендов. Упоминания в соцмедиа относятся к классу неструктурированных Big Data, составляющих до 90% всех генерируемых человечеством данных. И 68% из них — как раз мнения потребителей и граждан, имеющие первостепенное значение для бизнеса и государства», — подчеркнула Наталья Соколова, CEO Brand Analytics.

«Точность работы алгоритмов NER составляет порядка 90%. При этом даже системы на словарях дают точность не более 85%. Наше преимущество в том, что для NER вообще не используются словари. Если словарь слов нарицательных растет в экспоненциальной зависимости, и наиболее частотные слова можно учесть в словаре, то рост имен собственных близок к линейному. А это значит, что новые имена и названия появляются каждый день, и даже если попытаться учесть их, то это будет вторичная информация для системы. Наш модуль может сразу правильно типизировать имена собственные, хотя они никогда не встречались ранее», — пояснил Алексей Соловьев, научный руководитель лингвистической команды Brand Analytics.

В каждом из новых отчетов (персоны, компании, геообъекты) представлены: облако объектов, гистограмма лидеров роста и рейтинг объектов с абсолютными значениями упоминаемости и приростом относительно предыдущего периода. Все данные и графики доступны как в интерактивном виде, так и в выгружаемом отчете. Элементы отчета и объекты кликабельны и дают возможность исследования соответствующих срезов данных.

Что особенно важно для клиентов: каждый отчет включает пользовательский инструментарий для самостоятельной корректировки списка наблюдаемых объектов: объекты можно исключать из наблюдения или объединять несколько в единый объект. Таким способом решается задача подстройки отчета под персональные требования.


Пример: интерфейс интерактивного отчета «Персоны» при мониторинге тематики Нового года

Представленный инструментарий NER уже доступен ряду клиентов Brand Analytics, а в течение месяца станет доступным всем пользователям базового и более старших тарифов. В 2017 г. Brand Analytics планирует вывести ряд новых решений.