Разработчик Neuro.net представил новые SaaS-сервисы: распознавание и генерация речи в облаке
Российская компания-разработчик голосовых помощников и цифровых аватаров Neuro.net представила два облачных сервиса: ASRaaS и TTSaaS. Эти решения открывают новые возможности для автоматизации и оптимизации процессов в различных областях. Об этом CNews сообщили представители Neuro.net.
ASRaaS (Automatic Speech Recognition as a Service) предлагает мгновенное преобразование живой речи и аудиофайлов в текст. Это позволяет автоматизировать работу колл-центров, разрабатывать голосовых ассистентов и роботов, а также внедрять голосовое управление в приложения. Система принимает аудио и выдает текст, который может быть интегрирован в сторонние продукты.
Сервис синтеза речи TTSaaS (Text-to-Speech as a Service) при помощи методов машинного обучения преобразовывает человеческую речь в текст. Обычно синтез речи используется для создания цифровых роботов, голосовых ассистентов и озвучки различного контента: видео, аудиокниг, игр, метавселенных. Создание сгенерированного голоса обходится значительно дешевле использования студийной записи профессиональных дикторов.
Облачные ASRaaS и TTSaaS являются эволюцией классических речевых технологий Neuro.net — Neuro ASR и TTS, которые используются большой четверкой операторов сотовой связи в своих повседневных коммуникациях с клиентами.
«Теперь распознавание и синтез речи доступны любым пользователям, а не только избранным корпоративным клиентам. При этом «под капотом» новых сервисов те же производительность и качество передовых Neuro ASR и TTS», — сказал операционный директор Neuro.net Денис Непомнящий.
Таким образом, любой разработчик программного обеспечения: будь то стартап, разрабатывающий голосового бота, или ИТ-отдел крупной компании, автоматизирующий колл-центр, может начать самостоятельно использовать ASR и TTSaaS через интеграцию сервисов в облачном аккаунте.