20 Июня 2024 17:20 20 Июн 2024 17:20 |

Компания BSS добилась наилучшего качества распознавания казахского языка

Технология ASR необходима для распознавания устной речи клиентов, которые обращаются к виртуальному ассистенту с запросами. Чтобы оперативно обучить модель в условиях отсутствия исходных данных, разработчики использовали реальные диалоги на казахском языке, содержащие релевантную для заказчика лексику. Аналитики BSS тщательно транскрибировали 10 часов аудиоматериалов, перенеся корректно их в текстовый режим. Об этом CNews сообщили представители BSS.

Параллельно из открытых источников были собраны готовые речевые корпуса длительностью 1,5 тыс. часов. На основе этих данных была обучена первая базовая версия модели, качество распознавания устной речи которой составило 70%. Затем базовая модель ASR была дообучена транскрибированными аналитиками 10-часовыми аудиоматериалами. После второй итерации модель показала качество в 80% на целевых запросах клиентов. Сейчас разработчики BSS запускают новый цикл обучения ASR, чтобы улучшить показатель распознавание устной речи.

Почему open source требует стратегии и какой она должна быть

Цифровизация

«Наша команда показала выдающийся результат, разработав модель ASR за три месяца без исходных данных и сразу с уровнем качества в 80%. Мы собрали тестовый набор фраз клиентов заказчика и протестировали эти материалы на решениях других вендоров. Наша модель оказалась лучшей для заказчика, обогнав всех по качеству распознавания», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.

Он также отметил, что команда BSS осуществила переход модели ASR с архитектуры Conformer на ZIP-Former. «Это позволило ускорить ASR в три раза и повысить качество распознавания речи на 5%. Также благодаря переходу на более производительную архитектуру реакция бота сокращается на 200-500 мс, что повышает естественность диалога с клиентами», — сказал Александр Крушинский.

Подобрать оптимальный тариф на облачное резервное копирование BaaS на ИТ-маркетплейсе CNewsMarket

Подписаться на новости

Короткая ссылка

Компания BSS добилась наилучшего качества распознавания казахского языка

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

BaaS

СЭД

S3-хранилище

ERP

Техника

Обзор беспроводной акустической системы Hisense HT Saturn: новый уровень комфорта и погружения

Лучшие устройства Dreame на распродаже к 8 марта: выбор ZOOM

Лучшие моноблоки с диагональю 27 дюймов: хиты продаж

Наука

Когда и как водород попал на Землю? Крупнейший на планете резервуар — прямо у нас под носом

Почему наступают ледниковые периоды? Ученые назначили козлом отпущения Марс

Новое исследование показывает, что человеческий мозг работает на автопилоте две трети дня

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Топ-10
ИТ-трендов
в России на 2026 г.

Чем дольше тянешь с уходом от SAP,
тем дороже внедрение

Компания BSS добилась наилучшего качества распознавания казахского языка

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

BaaS

СЭД

S3-хранилище

ERP

Техника

Обзор беспроводной акустической системы Hisense HT Saturn: новый уровень комфорта и погружения

Лучшие устройства Dreame на распродаже к 8 марта: выбор ZOOM

Лучшие моноблоки с диагональю 27 дюймов: хиты продаж

Наука

Когда и как водород попал на Землю? Крупнейший на планете резервуар — прямо у нас под носом

Почему наступают ледниковые периоды? Ученые назначили козлом отпущения Марс

Новое исследование показывает, что человеческий мозг работает на автопилоте две трети дня

Топ-10 ИТ-трендов в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни, где, как и для чего»

Студентам говорят «используй ИИ при написании диплома, только объясни, где, как и для чего»

Топ-10 ИТ-трендов в России на 2026 г.

Чем дольше тянешь с уходом от SAP, тем дороже внедрение

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Топ-10
ИТ-трендов
в России на 2026 г.

Чем дольше тянешь с уходом от SAP,
тем дороже внедрение