Елена Прекрасная:как телеканал РБК внедрил виртуальную ведущую?

Виртуальная журналистика
Первого в мире цифрового ведущего для информагентства «Синьхуа» разработала китайская интернет-компания Sogou — в 2018 году аудитория Поднебесной впервые услышала новости из уст виртуальной копии любимого телеведущего Цю Хао. Мимика, голос, манера речи и характерные жесты: все вышло довольно реалистично. Ведь цифровой конкурент способен работать 24 часа в сутки 7 дней в неделю, он не нервничает, не высказывает своего мнения, не требует повышенного гонорара...
Похожий эксперимент проделал канал РБК, «приняв на работу» фотореалистичного визуального персонажа, рожденного в подразделении SberDevices. Аватар пробыл в эфире до 26 ноября и красовался в разделе «Видео дня» на главной странице канала.
«В эфире «Календарь инвестора». Онлайн ритейлер Ozon сегодня отчитается за третий квартал. Другой ритейлер, но американский, Walmart, тоже представит финансовый отчет... — хрупкая шатенка в сером пиджаке и белой рубашке приятным голосом, старательно расставляя паузы, зачитывает деловые новости. Движение губ синхронизировано со словами, девушка моргает, жестикулирует.
В «Сбере» отмечают, что могут настроить тон голоса и внешний вид аватара так, как нужно заказчику — именно поэтому Елену удалось довольно органично вписать в стилистику РБК. Полного ощущения, что перед нами живой человек, конечно, нет – но, может, оно и к лучшему. Иначе, как минимум, чувствуешь себя во вселенной «Бегущего по лезвию»...
«Для РБК — это интересный и важный эксперимент, — признается управляющий директор телеканала РБК Илья Доронов. — Подобные технологии развиваются во всем мире, и через какое-то время мы увидим виртуальных ведущих на многих каналах. Поэтому нам особенно приятно, что мы стали первыми, кто решился испытать Елену в эфире телеканала».
Увидеть Елену можно и в программе «Рынки», которая выходит в эфир каждый час с 7 утра до 7 вечера, и после 9 — в формате большого итогового выпуска. Там она невозмутимо зачитывает свежую информацию о главных событиях с мировых фондовых рынков. Появляется виртуальная красавица в самом конце — ее представляет телеведущий Владимир Левченко, предлагая рассказать о ситуации на валютном рынке.
К слову, Елена не только красивая, но еще и умная, и во время работы над контентом проявила себя неплохим корректором. Так, редактор, загружая цену нефти, по ошибке написал “82 доллара и 20 копеек”, а система сама исправила копейки на центы.
Процесс создания аватара непрост. Модель или актера снимают на несколько камер, чтобы получить датасет — обучающий материал для нейросети. Человек много работает с текстом, во время съемки ему приходится долго читать вслух, демонстрировать разные эмоции, чтобы нейросеть обучалась синхронизировать мимику, жестикуляцию и движения тела со словами. После все материалы отдаются на разметку и на обучение нейросети.

Как создавали Елену Прекрасную?
Разработкой визуальных персонажей в Сбере занимается команда Visper из SberDevices при участии коллег из Sber AR/VR Lab. Елена — их первое детище, и создавалась как ведущая новостей корпоративного канала компании. Технологию разработали еще два года назад в Лаборатории робототехники «Сбербанка» — это были первые эксперименты с визуальными персонажами. Уже после на базе их наработок команды SberDevices и Sber AR/VR Lab создали продукт Visper.
«Продукт делится на два сегмента. Первый — это сам text-to-video сервис Visper, на котором можно создавать видео с аватарами, выбрав подходящие образ и голос, — рассказывает технический директор SberDevices Денис Филиппов. — Мы создали целую библиотеку реалистичных и анимационных персонажей, которые совсем скоро дополнятся новыми образами».
Второй сегмент продукта — Visper Interactive. Это инфостенды с интерактивными аватарами, которые в режиме реального времени могут общаться с человеком. Приложения для аватаров создаются на основе технологий обработки естественного языка SmartNLP. Они доступны в хабе технологий «Сбера» SmartMarket и позволяют просто задавать логику диалога, предугадывать пол, возраст и даже эмоции клиента.
Процесс создания аватара непрост. Модель или актера снимают на несколько камер, чтобы получить датасет — обучающий материал для нейросети. Человек много работает с текстом, во время съемки ему приходится долго читать вслух, демонстрировать разные эмоции, чтобы нейросеть обучалась синхронизировать мимику, жестикуляцию и движения тела со словами. После все материалы отдаются на разметку и на обучение нейросети.
Далее разработчики работают над персонажами, обучают их, оттачивают эмоциональные движения, улучшают совпадение мимики с текстом. Задача визуального персонажа – читать текст, а вот более сложные действия доступны аватарам Visper interactive. Так, персонаж в инфостенде обрабатывает запросы пользователей в реальном времени и генерирует ответы на основе заранее заданной базы знаний. В перспективе, надеются разработчики, он может узнавать пользователей и поддерживать беседу на отвлеченные темы.

Где еще появится цифровая Елена?
После создания Елены команда Visper опросила сотрудников банка и провела исследование, чтобы узнать, где визуальный персонаж пришелся бы кстати. В итоге родилась идея сделать сервис, позволяющий создавать видео с персонажами и даже загружать свою презентацию и фотографии.
Кстати, одним из первых «мест работы» Елены действительно стали новости на устройствах «Сбера» — возможно, именно потому амплуа ведущей ей так к лицу. А еще она озвучивает ролики-инструкции для новых сотрудников. Также виртуальную журналистку можно увидеть на разных выставках и конференциях: например, она принимала участие в Moscow Creative Week, конференции по маркетингу от Weborama и CG event — самой крупной в России конференции по компьютерной графике.
«Такой визуальный персонаж может использоваться везде, где людям нужна навигация или справочная информация: в музеях, торговых центрах, отелях, госучреждениях. Инфостенд с аватаром, по сути, выполняет функцию консультанта или консьержа», — объясняет Денис Филиппов.
Как бы то ни было, в ближайшем будущем мы станем сталкиваться с цифровыми братьями и сестрами Елены все чаще.