«Центр речевых технологий» выпустил новое решение для преобразования речи в текст

Софт Бизнес-приложения
мобильная версия

«Центр речевых технологий» представил Voco — новое решение для преобразования речи в текст. Как сообщили CNews в ЦРТ, Voco позволяет набирать текст голосом в любом текстовом поле, например: в MS Word, Skype, окне электронной почты.

«Это не просто распознавание голосовых команд или простых запросов, к чему мы уже привыкли на своих смартфонах и планшетах. Это полноценное распознавание слитной речи, по скорости выигрывающее у опытного пользователя ПК в 1,5-3 раза, — утверждают в компании. — Вы просто произносите сообщение, которое хотите записать, и распознанный текст появляется на экране. Знаки препинания и абзацы приложение расставляет по команде».

Помимо собственно голосового набора, расширенные версии Voco позволяют распознавать текст из аудиофайла. Конвертация осуществляется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.

Автоматическая текстовая расшифровка аудиофайлов позволит экономить время всем, кто работает с аудиозаписями: журналистам, юристам, переводчикам и специалистам многих других профессий. «Чем лучше качество записи, тем, соответственно, точнее будет распознанный текст», — отметили в ЦРТ.

Базовая версия Voco знает порядка 85 тыс. слов. При этом программу можно обучить при помощи своих документов и писем. Изучив их, Voco добавит в свой словарь часто используемые пользователем слова и выражения. Расширенные версии программы включают профессиональные словари (сейчас это юридическая и финансовая тематика), количество которых постоянно пополняется.

В то же время, Voco отличает автономность. Выход в интернет требуется только для активации продукта или скачивания обновлений.

В целом, по словам разработчиков, Voco — это приложение для профессиональной работы с текстом. Его можно использовать для деловой переписки, диктовки постов, написания книг или сценариев, подготовки лекционного материала, договоров или судебных решений. Возможности программы позволяют быстро набирать текст голосом, тратя минимальное количество времени на исправление ошибок. Автоматическая расшифровка аудиофайлов позволит оперативно перевести интервью, лекции и другие записи в текст, отметили в компании.

Один из факторов, влияющих на качество распознавания — микрофон, в который диктует пользователь. В комплекте с расширенными версиями Voco поставляются профессиональные модели гарнитур компании Jabra. По результатам исследований, проведенных командой ЦРТ в процессе разработки приложения, гарнитуры Jabra полностью отвечают требованиям к точности фиксации звука, которая обеспечивается благодаря технологии цифровой обработки сигнала (DSP) и шумоподавлению, что позволяет достичь должного качества распознавания и голосового набора текста, указали в ЦРТ.

Для работы с Voco предлагаются моно-гарнитура Jabra Motion и решения в стерео-исполнении Jabra UC Voice 550 Duo и Jabra Evolve 65 Duo.