Разделы

Интернет Веб-сервисы Цифровизация Облака Маркет

Запущен сервис Yandex Vision, который будет конкурировать с Abbyy и распознавать лица

«Яндекс.облако» открыло доступ к собственной технологии компьютерного зрения, ранее применявшейся только в проектах «Яндекса». Теперь сторонние разработчики смогут встроить в свои программы функции распознавания текста, классификации изображений и определения присутствия людей на фотографиях.

Новый сервис в облаке «Яндекса»

«Яндекс» запустил на своей облачной платформе «Яндекс.облако» сервис Yandex Vision. Новый сервис предназначен исключительно для разработчиков ПО и предлагает набор технологий компьютерного зрения «Яндекса» для распознавания информации на изображениях. Он объединяет технологии оптического распознавания символов (OCR, Optical character recognition), классификации изображений и обнаружения лиц.

Ранее Yandex Vision, как рассказали CNews в компании, использовался только во внутренних проектах, в частности в поисковом движке и переводчике «Яндекса».

Представители «Яндекса» в разговоре с CNews в числе конкурентов Yandex Vision назвали решения Google‎ и Abbyy. Действительно, Google Cloud Vision API и Abbyy OCR Cloud SDK схожи по назначению и функциональности с новым облачным сервисом «Яндекса».

Yandex Vision, как утверждают представители компании, легко интегрируется с приложениями через интерфейсы REST API или gRPC API, а для осуществления интеграции от разработчика не требуется наличие опыта в области машинного обучения.

Распознавание текста

С помощью сервиса Yandex Vision разработчики могут добавлять в собственные продукты функцию распознавания текста в документах и изображениях. Если оцифрованное изображение (фотография, сканированная страница) содержит текст, то Yandex Vision его распознает. На данный момент сервис поддерживает более 40 языков, в том числе языки стран СНГ.

yandex600.jpg
«Яндекс.облако» открыло доступ к собственной технологии компьютерного зрения

Такие показатели достигаются при распознавании машинописных источников хорошего качества. Согласно документации, опубликованной на сайте «Яндекс.облака», сейчас сервис работает с некоторыми ограничениями, к примеру, алгоритм Yandex Vision не лучшим образом распознает рукописный, вертикальный или очень крупный текст.

Главными конкурентными преимуществами нового сервиса в «Яндексе» считают низкую цену – около 0,1 руб. за страницу распознанного текста, высокую скорость работы алгоритма (1–2 секунды на страницу документа), а также высокое качество итогового результата. По данным «Яндекса», для набора сфотографированных и отсканированных документов русский и английский тексты распознаются со средней точностью около 96%, казахский – 94%.

Обнаружение лиц и классификация изображений

Помимо распознавания текста Yandex Vision также позволяет определить наличие лиц на изображении и их количество, а также получить их координаты для последующей обработки. Например, возможно найти все лица на загруженных пользователем фотографиях и предложить отметить знакомых людей.

Технология классификации изображений поможет проанализировать контент, который загружают пользователи, чтобы, к примеру, выявить нарушение авторских прав по наличию водяных знаков или отфильтровать нежелательный контент.

Возможности Yandex Vision по обнаружению лиц и классификации изображений в настоящее время находятся на стадии превью, поэтому предоставляются бесплатно.

Планы по развитию сервиса

Отвечая на вопрос CNews о планах по развитию Yandex Vision, представители «Яндекса» рассказали, что планируют работать над увеличением количества сервисов компьютерного зрения как для обработки документов, так и для работы с фотографиями и видеопотоком.

Напомним, что разработкой ПО для распознавания символов в видеопотоке занимается другая российская компания – Smart Engines. CNews ранее рассказывал о некоторых ее проектах, в частности о системе распознавания паспортов, модуле для мобильного приложения 6profis, используемого легальными секс-работниками Германии, а также программе распознавания танков.

Первый опыт применения

Рассказывая о примерах практического применения Yandex Vision вне «Яндекса», представители компании цитируют слова Сергея Юдовского, главы компании Electroneek Robotics, занимающейся развитием платформы для автоматизации бизнес-задач: «Мы внедрили Yandex Vision в нашу платформу для автоматизации бизнес-задач и получили десятикратное ускорение обработки документов, возможность полностью исключить ручной труд при переносе данных системы документооборота».

Отдельно Юдовский отмечает высокое качество работы сервиса с текстами на языках стран СНГ.

Подробнее о «Яндекс.облаке»

О доступности набора инфраструктурных и платформенных сервисов, объединенных под брендом «Яндекс.облако», для всех желающих стало известно в декабре 2018 г., а публично о запуске «Облака» было объявлено в начале сентября 2018 г.

«Облако» позволяет получить доступ к масштабируемой виртуальной инфраструктуре, сервисам управления базами данных, распознавания и синтеза речи, машинного перевода и прочим услугам. Центры обработки данных «Яндекс.облака» расположены в России, что позволяет пользователям облачных услуг соблюдать закон 152-ФЗ «О персональных данных» с учетом последних поправок, которые обязывают компании, имеющие дело с персональными данными россиян, хранить эти данные на территории России. По состоянию на 2018 г. «Яндекс» владеет четырьмя ЦОДами в Москве и Подмосковье, по одному – в Рязанской области и Финляндии, а также одним дата-центром во Владимире.

Александр Глазков, «Диасофт»: Главная проблема с импортозамещением — у новых решений нет опыта эксплуатации в реальной жизни

ИТ в банках

По данным «Яндекса», в первые три месяца с момента анонса «Облаком» заинтересовались свыше 10 тыс. российских и международных компаний, а с апреля 2018 г. по сентябрь 2018 г. им воспользовались более 50 компаний, специально приглашенных «Яндексом» для участия в тестировании. Среди них «Тинькофф банк», X5 Retail Group (магазины «Пятерочка», «Карусель», «Перекресток»), авиакомпания S7, платформа для управления бизнесом «Битрикс24».

В числе известных пользователей платформы также назывались: российское представительство американского издательства Condé Nast, выбравшее ее с целью размещения мультимедийных веб-сайтов; MerlionCloud, российский дистрибьютор облачных решений, который предложил услугу резервного копирования и восстановления данных на базе продуктов Commvault с использованием объектного хранилища «Облака»; отечественный поставщик услуг в сфере Wi-Fi-маркетинга Hot-Wi-Fi, развернувший свои базы данных на инфраструктуре «Яндекса»; онлайн-школа английского языка Skyeng, которая также перенесла свою среду разработки в облако «Яндекса».

В начале апреля 2019 г. в облаке был запущен сервис визуализации и сопоставления пользователями своих корпоративных данных, позволив «Яндексу» выйти на рынок облачной бизнес-аналитики, где своими конкурентами компания видит Google Data Studio и Microsoft Power BI.

Дмитрий Степанов