Телеком Big Data

12 Октября 2016 15:59 12 Окт 2016 15:59 |

«ЦРТ-инновации» представили новую технологию кластерного анализа больших массивов речевых данных для контакт-центров

Компания «ЦРТ-инновации» совместно с Министерством образования и науки РФ разработала технологию кластерного анализа — автоматического структурирования и понимания больших массивов речевых данных. Технология базируется на основных принципах работы с большими данными и использует для реализации алгоритмов передовые методы машинного обучения, сообщили CNews в ЦРТ.

Ожидается, что разработка будет применяться в крупных контакт-центрах и службах поддержки, где ежедневно накапливается большой объем записей телефонных переговоров «клиент-оператор» и часто возникает необходимость получить информацию о составе, структуре и содержании новой, незнакомой аналитику базы данных.

Полученная информация может быть использована для выявления наиболее частых поводов обращения абонентов в контакт-центр, обнаружения связи между этими обращениями, определения объемов кластеров таких обращений, перевода обслуживания по некоторым типам обращений в автоматический режим (IVR) и т.п.

«Особенностями разработанной нами технологии являются возможность автоматической адаптации используемого алгоритма к новой предметной области (обучение системы на целевой выборке происходит без участия эксперта-аналитика, что делает данную систему экономически выгодной и производительной) и наличие специально разработанных алгоритмов предобработки данных, позволяющих выделить наиболее информативные смысловые центры (так называемые “паттерны”) диалогов “клиент-оператор” и исключить из рассмотрения неинформативные (“мусорные”) фрагменты диалогов», — рассказал R&D-директор группы ЦРТ Кирилл Левин.

Технология кластерного анализа входит в состав предлагаемой «ЦРТ-инновациями» универсальной методики, основанной на таких последовательных принципах извлечения информации (information retrieval) из неструктурированных массивов речевых данных и их интеллектуального анализа (data mining), как: кластерный анализ (или «кластеризация»); поиск и фильтрация «статистических выбросов» или «аномалий»; и выявление наиболее значимых слов и фраз и последующее составление текстовых аннотаций, содержащих в себе информативную составляющую речи.

Дмитрий Балдин, «РусГидро»: Вынужденный переход на open source приводит к увеличению поверхности кибератак

безопасность

Так, кластерный анализ речевых данных предполагает разделение массива неструктурированных данных на кластеры, объединяемые общим критерием (темой). Полученные кластеры имеют озаглавленную иерархическую (древовидную) структуру, что позволяет решать реальные задачи аналитиков контакт-центров, так как такое представление данных в полной мере отражает связность, вложенность и относительный объем данных различных кластеров (тем), пояснили в ЦРТ. Алгоритм основан на методе машинного обучения «без учителя» (unsupervised learning) с применением алгоритмов k-means и LDA на каждом шаге иерархической кластеризации.

«Статистические выбросы» или «аномалии» подразумевают звукозаписи переговоров, нетипичные для данной выборки по какому-либо критерию (например, наличие бытовых разговоров (с родственниками или знакомыми) среди звукозаписей рабочих переговоров). Алгоритм поиска и фильтрации основан на методе машинного обучения «без учителя» (unsupervised learning), использующего метод one-class-svm.

Обзор российского электромобиля АТОМ — машина-гаджет, первый тест в России

Татьяна Короткова

Подписаться на новости

Короткая ссылка

«ЦРТ-инновации» представили новую технологию кластерного анализа больших массивов речевых данных для контакт-центров

Другие материалы рубрики

MARKET.CNEWS

S3-хранилище

Dedicated

Онлайн-бухгалтерия

ИТ-безопасность

Техника

Легальные приложения для отслеживания смартфона по местоположению: выбор ZOOM

Обзор моноблока HIPER EXPERTCENTER D27: солидный универсал

Как обустроить быт в палатке: лучшие гаджеты для походов

Наука

На дне российской шахты найдены уникальные термиты — они сохранились в янтаре возрастом 38 миллионов лет

На каком языке думают нейросети?

«Ангара А5» и другие самые интересные космические миссии в 2024 году

О настоящем и будущем интернета вещей в России

Администрировать нашу платформу
так же удобно, как Microsoft Exchange

О настоящем и будущем интернета вещей в России

Таких темпов роста нашей электронной отрасли не было никогда

Администрировать нашу платформу так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили
разработку программного кода

«ЦРТ-инновации» представили новую технологию кластерного анализа больших массивов речевых данных для контакт-центров

Другие материалы рубрики

MARKET.CNEWS

S3-хранилище

Dedicated

Онлайн-бухгалтерия

ИТ-безопасность

Техника

Легальные приложения для отслеживания смартфона по местоположению: выбор ZOOM

Обзор моноблока HIPER EXPERTCENTER D27: солидный универсал

Как обустроить быт в палатке: лучшие гаджеты для походов

Наука

На дне российской шахты найдены уникальные термиты — они сохранились в янтаре возрастом 38 миллионов лет

На каком языке думают нейросети?

«Ангара А5» и другие самые интересные космические миссии в 2024 году

О настоящем и будущем интернета вещей в России

Администрировать нашу платформу так же удобно, как Microsoft Exchange

О настоящем и будущем интернета вещей в России

Таких темпов роста нашей электронной отрасли не было никогда

Администрировать нашу платформу так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили разработку программного кода

Администрировать нашу платформу
так же удобно, как Microsoft Exchange

Мы в 4 раза ускорили
разработку программного кода