Разделы

Интернет Веб-сервисы

«Яндекс» перешел на собственный движок распознавания речи

«Яндекс» объявил о переходе на Yandex SpeechKit - собственный движок распознавания русской речи в мобильных приложениях. Технология бесплатно предоставляется разработчикам с ограничением 10 тыс. запросов в день.

«Яндекс» объявил о переходе на использование в мобильных приложениях технологии распознавания голоса собственной разработки под названием Yandex SpeechKit. До этого поисковик использовал для этих целей платформу, созданную компанией Nuance.

Yandex SpeechKit работает в операционных системах iOS и Android, поддерживает, по словам создателей, две темы запросов: «общую» (все, что ищут в интернете) и «гео», связанную с поиском адресов, названий организаций и т.п.

Голосовой ввод сейчас доступен только на русском языке, таким образом украинская и турецкая версии поисковика по-прежнему продолжают использовать движок Nuance.

Библиотеки Yandex SpeechKit как для Android, так и для iOS разработчикам предоставляются бесплатно, однако число бесплатных запросов к движку распознавания голоса ограничено 10 тыс. запросов в день. Стоимость обращения при превышении этого числа не установлена, сообщили CNews в «Яндексе».

Публикация Yandex SpeechKit именно для мобильных платформ, по словам руководителя проекта Дениса Филиппова, была обусловлена особенной актуальностью голосовых технологий « там, где есть сложности с текстовым вводом, а это прежде всего мобильные устройства». Но, говорит Филиппов, он думает и над созданием фреймворка и для десктопных приложений.

Дискуссия в метавселенной: ИИ, обмен данными и иммерсивные сценарии
ИТ в банках

По результатам внутренних исследований поисковика, Yandex SpeechKit способен верно распознавать 84% слов в «общепоисковой» категории и 94% слов – по геозапросам. Средняя скорость распознавания составляет 1,1 секунды.

При создании Yandex SpeechKit было использовано около 300 часов мужской, женской и детской речи для обучения акустических моделей и «сотни миллионов специально подготовленных текстов» для обучения языковой модели.


Руководитель проекта Yandex SpeechKit Денис Филиппов

Стоит заметить, что API распознавания речи для мобильных устройств (но исключительно под управлением Android) предоставляется Google (API android.speech). В его описании ограничение на количество бесплатных обращений не встречается.

Владислав Мещеряков