Разделы

Телеком Интернет ПО Мобильная связь Веб-сервисы Софт

Россияне учат iPhone записывать SMS с голоса

В этом году на рынке появится первое приложение для трансляции русской разговорной речи в текст, сообщил CNews его разработчик «Центр речевых технологий». Первые «диктовочные» решения ориентированы на работу с SMS, чатами и соцсетями, и будут доступны для различных мобильных платформ, включая iPhone.

До конца 2011 г. на рынок выйдет первое приложение класса «диктовочный блокнот», предназначенное для преобразования надиктованной русской речи в текст. Об этом рассказал CNews директор питерского «Центра речевых технологий» Михаил Хитров. Приложение будет выпущено для нескольких мобильных платформ, включая и iOS.

Сама система для распознавания русской слитной речи «Руссограф» была создана в «Центре речевых технологий» (ЦРТ) еще в 2008 г., появление массовых решений на ее основе тормозилось необходимостью создания словаря словоформ. Как говорит рукодвитель группы в ЦРТ Алексей Рыбаков, если для создания англоязычного продукта достаточно словарной базы размером 5 тыс. словоформ, то для русскоязычного требуется 500 тыс.

Михаил Хитров добавляет, что, помимо накопления словарей, «речь шла о придании платформе большей интеллектуальности, способности правильно обрабатывать множество похожих форм слов и учитывать правила русского языка».

Сейчас в мире существуют только два математических ядра для работы со слитной русской речью, одно из которых принадлежит разработчикам ЦРТ, а другое — компании из Массачусетса Nuance Communications.

Nuance хорошо известна своими «диктовочными» продуктами из семейства Dragon, выпущенными, в том числе и для мобильных платформ. Они адресованы, главным образом, англоговорящим пользователям. «Диктовального блокнота», основанного на «русском» ядре, у Nuance пока нет.


Интерес к мобильным «распознавалкам речи» усилился, когда Google запустил голосовой поиск

С чего начать импортозамещение в ИБ?
Импортонезависимость

Интересно, что в процессе разработки своих продуктов, и в Nuance, и в ЦРТ пришли к выводу, что наиболее простым для разработки и одновременно актуальным для рынка являются приложения, ориентированные на применение в медицине. Это обусловлено, с одной стороны, высокой стоимостью рабочего времени западного врача, а с другой — с высокой регламентацией профессиональной речи медицинского работника, что позволяет со сравнительно небольшими усилиями создавать специализированные словарные базы.

Помимо «медицинского» приложения, в ЦРТ существуют наработки для диктовки новостей: «Более того, даже внутри новостной тематики мы выделяем различные тематики: спорт, экономика, политика», - говорит Михаил Хитров.

Однако, в первую очередь, по словам руководителя ЦРТ, на рынке появится мобильное приложение разговорной тематики, востребованной у конечных пользователей, для работы с SMS, электронной почтой, чатами, сообщениями в социальных сетях и блогах.

Насколько известно CNews, сейчас осуществляется как минимум одно промышленное внедрение «диктовочного» решения ЦРТ - в медицинских учреждениях Санкт-Петербурга по заказу городского правительства. ЦРТ, подтверждая сам факт внедрения, не раскрывает по этому поводу никаких подробностей.

Владислав Мещеряков