ВТБ внедрил систему для разметки данных «Маркер», разработанную компанией «Наносемантика»
ВТБ совместно с «Наносемантикой», одним из ведущих разработчиков технологий искусственного интеллекта, внедрил в свой защищенный контур сервис для разметки данных «Маркер». Об этом CNews сообщили представители «Наносемантики».
«Маркер» – это инструмент для подготовки размеченных данных для обучения математических моделей.
Изначально сервис был разработан для внутренних задач «Наносемантики», а впоследствии продуктом заинтересовались и другие компании, использующие в работе большие данные и искусственный интеллект. Одна из таких компаний – банк ВТБ, который искал универсальную промышленную платформу, позволяющую гибко реализовывать любые задачи по разметке данных и самостоятельно администрировать этот процесс штатными специалистами.
В рамках сотрудничества «Наносемантики» и ВТБ система «Маркер» была внедрена в защищенный контур банка для выполнения следующих задач:
•разметка текстовых данных для различных задач машинного обучения;
•разметка аудио-файлов для задач колл-центра.
Сервис «Наносемантики» позволит ВТБ максимально сократить время работы специалистов по подготовке данных и количество ошибок при формировании набора обучающих данных. «Маркер» гарантирует контроль качества подготовки данных и защиту персональных данных, поскольку платформа развернута в защищенном контуре ВТБ.
В рамках сотрудничества планируется и расширение функционала платформы. Так, в будущем будут добавлены такие функции как разметка видео и разметка изображений.
«Развитие BigData и Data Science требует более комплексного подхода к подготовке данных для ряда математических моделей, требующих большого объема ручной разметки для обучения. Внедрение специализированного инструмента для разметки данных поможет сделать разметку более удобной для пользователей и сократить time to market многих моделей машинному обучения», – отметил Олег Муравьев, заместитель руководителя департамента анализа данных и моделирования ВТБ.
***
«Наносемантика» – российский разработчик текстовых и голосовых ассистентов на основе собственных технологий (NLP-платформа NLab, язык лингвистического программирования Dialog Language).