Разделы

Интернет Веб-сервисы Цифровизация

Yandex Cloud научила искусственный интеллект расставлять знаки препинания при распознавании речи

Облачная платформа Yandex Cloud обновила Yandex SpeechKit — сервис для синтеза и распознавания речи на базе машинного обучения. Теперь при переводе голоса в текст сервис автоматически расставляет необходимые знаки препинания. Это улучшит опыт пользователей в сценариях, где с речевыми технологиями напрямую взаимодействует человек. Об этом CNews сообщили представители Yandex Cloud.

Например, общение с голосовым помощником, автоматическое транскрибирование или формирование субтитров. Распознанный нейросетью текст максимально приближен к литературному и проще воспринимается читателем.

Новая функция Yandex SpeechKit называется «Пунктуатор» и работает как при распознавании в реальном времени для сценариев с голосовыми помощниками, так и при распознавании предзаписанных аудиофайлов.

«Пунктуатор» разработан с помощью двух последовательно работающих моделей машинного обучения. Первая переводит голос в текст, вторая расставляет знаки препинания в соответствии с нормами русского языка. Сейчас модель расставляет все основные знаки пунктуации русского языка. «Пуктуатор» доступен для всех пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

«Мы развиваем сервисы Yandex Cloud, отвечая на запросы наших клиентов, а иногда и предвосхищая их. Многие наши заказчики, сегодня используют Yandex SpeechKit для создания голосовых помощников с диалоговым интерфейсом. В таких проектах распознанный машиной текст важно сделать максимально приближенным к тому, как его написал бы реальный собеседник. “Пунктуатор” решает эту задачу просто», – сказал Василий Ершов, руководитель разработки Yandex SpeechKit.



37-я международная выставка информационных и коммуникационных технологий Связь-2025 37-я международная выставка информационных и коммуникационных технологий Связь-2025

erid: 2W5zFHRYEHv

Рекламодатель: АКЦИОНЕРНОЕ ОБЩЕСТВО «ЭКСПОЦЕНТР»

ИНН/ОГРН: 7718033809/1027700167153