«Яндекс» опубликовал принципы синтеза речи
«Яндекс» сделал общедоступным внутренний документ, в котором описаны принципы компании при работе с технологией синтеза речи. Это нормы и правила, которые, на взгляд «Яндекса», позволяют сделать технологию комфортной и безопасной для всех, кто с ней так или иначе соприкасается. Об этом CNews сообщили представители «Яндекса».
В документе рассказывается, как «Яндекс» обрабатывает данные синтеза — они хранятся в дата-центрах компании, соответствующих индустриальным требованиям безопасности, — как строится работа над технологией и какие ограничения действуют при ее использовании. Отдельное внимание уделено дикторам — людям, на чьих голосах обучается модель синтеза. «Яндекс» запрашивает у них согласие на использование голоса и объясняет им, что их голосами впоследствии будут озвучены произвольные тексты.
«Наши принципы будут полезны всем, кто имеет дело с синтезом речи: звукозаписывающим студиям, разработчикам технологии и компаниям, которые ее у себя внедряют. Если наш подход разделят другие участники рынка, в будущем он сможет послужить основой для отраслевого стандарта», — сказал директор «Яндекса» по развитию технологий искусственного интеллекта Александр Крайнов.

«Союз дикторов приветствует инициативу «Яндекс» по разработке этических норм при работе с синтезом речи. Это первый, но важный шаг по защите голосов дикторов и актеров. Мы поддерживаем идею предложить им прозрачные условия работы — когда компания детально информирует их о том, как может быть использован голос. Пока законодательные меры еще не приняты, поэтому Союз дикторов рекомендует дикторам и актерам внимательно выбирать проекты для участия. В любом случае мы рады, что поднимается тема этики — это может стимулировать развитие качественного партнерства разработчиков, студий и дикторов», — отметил Александр Лапшин, председатель Союза дикторов России.
«Яндекс» с 2012 г. развивает собственные речевые технологии, в том числе технологию синтеза речи. Она используется в «Алисе», «Браузере», «Книгах», «Навигаторе», «Картах» и других сервисах. Технология доступна внешним пользователям в составе сервиса Yandex SpeechKit на облачной платформе Yandex Cloud. Ее можно применять для создания голосовых помощников, автоматизации коммуникаций в колл-центрах, озвучивания книг и не только.