Нейросети «Яндекса» помогут сохранить языки народов России и ближе познакомиться с их культурой. «Яндекс» добавит в «Переводчик» более 20 языков народов России.
«Яндекс» добавит в «Переводчик» более 20 языков народов России, ранее не представленных в сервисе. Проект рассчитан на три года, а первый из новых языков — осетинский — уже появился в Переводчике. Для части языков будет также встроена нейросетевая технология распознавания и синтеза речи. Это позволит узнать, как звучат слова на разных языках, и вскоре даст возможность вести диалог с носителями. Мобильная версия сервиса мгновенно переведет реплики, отобразит их на экране и озвучит на выбранном языке. Первым языком народов России, для которого вскоре будет реализована такая возможность, станет татарский. Об этом CNews сообщили представители «Яндекса».
Распознавание и синтез речи в дальнейшем будут доступны для более чем десяти популярных языков, на каждом из которых в стране говорят более 300 тыс. человек. Технологии «Яндекса» позволят переводить сайты в «Браузере», а также использовать голосовой ввод в «Поиске», «Картах» и мессенджерах с помощью «Яндекс Клавиатуры». Для всех пользователей это возможность лучше познакомиться с культурными особенностями народов страны через перевод их преданий, легенд, краеведческих статей и других материалов. Кроме того, виртуальный ассистент «Алиса» научится читать на этих языках народные сказки.

По данным «Яндекс Поиска», россияне ищут в интернете перевод фраз на татарском чаще, чем на других языках народов России. На втором месте — башкирский, третьим по популярности среди пользователей рунета является чувашский. Эти и другие языки, такие как удмуртский, якутский, горномарийский и марийский, уже доступны в «Переводчике», часть из них — в бета-версии. «Яндекс» планирует улучшить качество перевода доступных языков, а также увеличить их количество. Так, к примеру, в «Переводчик» будут добавлены языки Северного Кавказа: чеченский, ингушский и др., а позже и языки народов Сибири, например: бурятский и тувинский.
«Яндекс» реализует проект совместно с Федеральным агентством по делам национальностей и региональными языковыми институтами. Они помогают компании со сбором корпусов языков народов России — параллельных текстов на разных языках.