Specom 2007: распознавание речи работает на силовиков
На российском рынке наблюдается рост интереса к разработкам в области систем распознавания речи (СРР). Он высок как со стороны государственных структур, так и со стороны коммерческих организаций. Однако большая часть разрабатываемых продуктов все же подстраивается под госнужды, поскольку силовые ведомства уже давно понимают необходимость перехода на более совершенные технологии. Они могли бы помочь в борьбе с преступностью, в обеспечении ИБ и шифровании данных. Именно госструктуры выделяют деньги на проведение исследований и создание ПО. Но, к сожалению, во взаимоотношениях заказчик-разработчик все не так гладко, как могло бы быть.Довольно радужные перспективы у систем автоматизированного перевода. Работы по их созданию велись с пятидесятых годов прошлого века, но лишь недавно в этом направлении наметился прорыв. Уже существуют программы, способные переводить тексты без участия человека. К сожалению, пока перевод осуществляется только для каких-то профессиональных областей. Профессиональный язык более структурирован и менее гибок, чем свободная речь. Но исследователи не теряют оптимизма.
Михаил Андреев: За несколько лет своего существования консорциум
"Российские речевые технологии" ни на шаг не приблизился к решению своих
проблем
Немаловажной для коммерческих организаций является также возможность защиты внутренней информации при помощи речевых технологий. Существующие системы вычленяют в речи работника ключевые фразы, что часто помогает предотвратить утечку важной информации. К сожалению, пока процент ложных срабатываний еще довольно велик и может достигать 25%. Однако метод лингвистического анализа для обеспечения ИБ достаточно эффективен и с улучшением словарей и шаблонов будет все чаще использоваться для предотвращения утечек конфиденциальной информации.
Лингвисты на страже интересов
Как уже было сказано, большая часть компаний, занимающихся системами распознавания речи, работает по заказам госструктур и силовых ведомств. Ведь именно для них наиболее актуальны системы, благодаря которым можно провести криминалистический анализ речи или, наоборот, защитить свидетеля, полностью изменив его голос при опознании преступника. Подобные системы широко используются и для идентификации преступника по голосу. Например, в Великобритании с 1991 года все разговоры подозреваемых записываются на пленку, что очень облегчает процесс последующего опознания преступника и создания доказательной базы. Ряд организаций занимается разработками в области шифрования голосовых данных, которые выполняются по заказу силовых ведомств. В России процесс разработки и продажи таких систем жестко контролируется государством посредством лицензирования.
Многие государства также субсидируют работы лабораторий, которые занимаются созданием специальных средств для людей с ограниченными возможностями. Здесь у систем автоматического распознавания речи большие перспективы. При их помощи создаются аудиобиблиотеки, управляемые голосом, что актуально для слабовидящих людей. Посредством диалога "человек-машина" пользователь может прослушивать полученные сообщения, читать книги, общаться с друзьями. Подобные технологии уже существуют и для ряда славянских языков, но пока они находятся в стадии опытных образцов.
По словам ученого из университета Джорджии, доктора Ли, проблему распознавания отдельных слогов и слов можно считать уже практически решенной
К сожалению, большинство уже существующих на рынке систем, предназначенных для обычных пользователей, страдают серьезными недостатками: у них весьма низкая точность распознавания и довольно скудный словарь. Пользователи воспринимают их скорее как забавные игрушки, что, в общем и целом, создало системам управления голосом несколько негативный имидж.
Для людей со слуховыми ограничениями создаются автоматические системы транскрипции новостных передач с использованием технологий распознавания речи. Несмотря на большое количество сложностей (система должна отделять посторонние шумы и музыку от основного текста) в этом направлении есть явные успехи. На коференции Specom 2007 французский исследователь Жан-Поль Атон представил свою систему для транскрибирования телепередач онлайн, которая с достаточно большой точностью синтезировала текст на основе спонтанной речи.
Современный уровень развития речевых технологий позволяет предположить, что уже в самом ближайшем будущем продукты, созданные на основе технологий синтеза и распознавания речи, станут более совершенными и будут востребованы во множестве отраслей. Доклады и работы, представленные на Specom 2007, одной из крупнейших конференций, посвященных проблемам речи, наглядно об этом свидетельствуют
Российский рынок систем распознавания речи сейчас находится в стадии формирования. Но благодаря возросшему интересу к сетевым технологиям и пониманию актуальности этих проблем государством, уже можно говорить о начале его подъема. А решение проблем с финансированием отечественных разработчиков и коммерческих организаций позволит последним не только получить более качественный продукт, но и сделать его максимально конкурентоспособным на международном рынке.
Мякишева Марина / CNews