Цифровизация Бизнес-приложения Облака

14 Февраля 2017 14:44 14 Фев 2017 14:44 |

3i Technologies представил облачный сервис для профессиональной обработки ТВ и радио-контента

Консорциум 3i Technologies анонсировал облачный сервис, разработанный для профессиональной обработки речевых данных из медийного контента – 3i Speech Recognition API. Как рассказали CNews в компании, сервис позволяет с точностью более 90% переводить теле- и радио-эфиры и медиа-архивы ТВ-каналов и радиостанций в текстовый формат.

3i Speech Recognition API работает с аудио и видео любой длительности. Сервис обрабатывает загруженные в облако файлы в несколько раз быстрее реального времени звучания и выдает на выходе «стройный» текст, разбитый на предложения с расставленными знаками препинания. Бета-версия 3i Speech Recognition API открыта для публичного тестирования.

«Это специализированный сервис, ориентированный на обработку именно телевизионного или радио-контента. Мы разработали уникальные модели, которые позволили добиться очень высокой точности распознавания. Надеемся, что сервис будет полезен профессионалам, которые работают с медиа-контентом. В дальнейшем он может стать частью высокотехнологичных решений для массового потребителя, например, основой для перевода иностранных каналов и субтитрирования в режиме реального времени. Все технологии для создания такого продукта у компаний, входящих в консорциум, уже есть», - сказал председатель совета директоров консорциума 3i Technologies Алексей Любимов.

В сервисе используются языковые и акустические модели, построенные с применением машинного обучения, технологий рекуррентных нейронных сетей (Recurrent Neural Network, RNN) и взвешенных конечных автоматов (Weighted Finite State Transducer, WFST). Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU.

Языковые модели для повышения качества распознавания могут быть адаптированы под узкую предметную область. Например, для перевода в текст «экономических» или «отраслевых» передач, в которых спикеры используют профессиональную лексику.

Российские процессоры — инфографика CNews, проблемы, будущее Импортонезависимость

Бета-версия 3i Speech Recognition поддерживает русский и английский язык. 3i Speech Recognition будет полезен в работе разработчиков программного обеспечения, системных интеграторов, специалистов в области создания и обработки медиаконтента (телерадиовещательные компании, продакшн-студии, креативные агентства, фрилансеры и т.д.). Сервис быстро и легко интегрируется в приложения и комплексные решения сторонних разработчиков.

Консорциум 3i Technologies учрежден в 2014 году компаниями DSS Lab и InfoQubes, в 2016 к нему присоединилась компания PROMT. Консорциум объединяет российские научные и инженерные коллективы, специализирующиеся на разработке технологий, продуктов и сервисов интеллектуальной обработки больших массивов данных различной природы. 3i Technologies обладает уникальными технологиями поиска, обработки и анализа текстовой, аудио- и видеоинформации, которые защищены патентами и авторскими свидетельствами. Компании, входящие в консорциум, предлагают клиентам широкий спектр программной продукции: от мобильных приложений до комплексных прикладных ИТ-решений и программных библиотек для сторонних разработчиков. Программные решения 3i Technologies внедрены у клиентов, работающих в РФ и странах СНГ.

Лучшие тарифы на выделенные серверы Dedicated на ИТ-маркетплейсе CNewsMarket

Владимир Бахур

Подписаться на новости

Короткая ссылка

3i Technologies представил облачный сервис для профессиональной обработки ТВ и радио-контента

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

CRM

DBaaS

BaaS

DRaaS

Техника

Сравнение типов и видов клавиатур: какую выбрать?

Обзор iQOO Z11 Lite: долгоиграющий смартфон с Android 16

Когда нейросети могут быть полезны: можно ли доверять ИИ-диагностике в медицине, технике и других областях

Наука

Археологи обнаружили идеально круглый древнеегипетский храм с сетью водных сооружений

Создан прозрачный лак, который превращает ноготь в стилус для тачскрина

Внутри ядра Земли обнаружен неизвестный ранее слой — привычные модели строения планеты теперь под вопросом

Российские СУБД
на базе PostgreSQL
сравнили по 200 параметрам

Трафик — идеальный объект анализа?

Российские СУБД
на базе PostgreSQL
сравнили по 200 параметрам

Как ИИ выявляет в речи скрытые закономерности, незаметные человеку и стандартным алгоритмам

Трафик — идеальный объект анализа?

Нефункциональные требования:
как не провалить цифровизацию, следуя ГОСТу и здравому смыслу

3i Technologies представил облачный сервис для профессиональной обработки ТВ и радио-контента

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

CRM

DBaaS

BaaS

DRaaS

Техника

Сравнение типов и видов клавиатур: какую выбрать?

Обзор iQOO Z11 Lite: долгоиграющий смартфон с Android 16

Когда нейросети могут быть полезны: можно ли доверять ИИ-диагностике в медицине, технике и других областях

Наука

Археологи обнаружили идеально круглый древнеегипетский храм с сетью водных сооружений

Создан прозрачный лак, который превращает ноготь в стилус для тачскрина

Внутри ядра Земли обнаружен неизвестный ранее слой — привычные модели строения планеты теперь под вопросом

Российские СУБД на базе PostgreSQL сравнили по 200 параметрам

Трафик — идеальный объект анализа?

Российские СУБД на базе PostgreSQL сравнили по 200 параметрам

Как ИИ выявляет в речи скрытые закономерности, незаметные человеку и стандартным алгоритмам

Трафик — идеальный объект анализа?

Нефункциональные требования:как не провалить цифровизацию, следуя ГОСТу и здравому смыслу

Российские СУБД
на базе PostgreSQL
сравнили по 200 параметрам

Российские СУБД
на базе PostgreSQL
сравнили по 200 параметрам

Нефункциональные требования:
как не провалить цифровизацию, следуя ГОСТу и здравому смыслу