Спецпроекты

Владимир Арлазаров

Владимир Арлазаров:

Мы умеем распознавать 700 типов документов 165 стран

Ставшие модными сегодня системы искусственного интеллекта существуют в России уже давно. В основе их создания – целая научная школа, которая с 70-х годов прошлого века занимается изучением технологий распознавания. На ее базе разработан отечественный продукт, способный распознавать в видеопотоке и на изображениях 700 типов документов 165 стран и получивший признание не только в России, но и за рубежом. Об этом в интервью CNews рассказал Владимир Арлазаров, к.т.н., генеральный директор Smart Engines.

CNews: Сегодня много говорится о «Цифровой экономике» и, в частности, о перспективах использования искусственного интеллекта в самых разных отраслях. Вы уже заметили рост интереса к таким решениям?

Владимир Арлазаров: В нашей стране спрос на искусственный интеллект был всегда. Просто сейчас он приобрел форму четких, экономически обоснованных задач, которые нужно решить. Если говорить о запросах, которые получает наша компания, то это в первую очередь задачи по распознаванию документов и, конечно, распознаванию объектов, аномалий, выделению взаимозависимостей на изображениях, а также предсказанию либо поведения, либо событий на основе больших объемов данных.

При этом нельзя сказать, что эти задачи раньше не стояли. Биржевые игроки уже десятилетия пользуются искусственным интеллектом и машинным обучением для прогнозирования рынка. Просто сегодня технологии и научные достижения позволяют это делать с большим эффектом.

CNews: Какие предприятия особенно интересуются такими решениями?

Владимир Арлазаров: В России это финансовый и страховой сектор. На Западе еще и промышленные предприятия, для которых очень важно, например, прогнозировать поломки оборудования – благодаря этому можно сэкономить огромные средства. В России эту задачу пока решить достаточно сложно, потому что промышленности для этого надо сначала собрать данные.

У банков и страховых компаний данные были всегда. Их бизнес основан на выявлении зависимостей между ними. Сегодня в финансовых организациях объем данных увеличился и продолжает расти, а значит качество принимаемых искусственным интеллектом на их основе решений становится выше. Сфера применения решений на базе технологий машинного обучения также расширяется. Например, сейчас банки часто отказывают в кредите человеку не потому, что у них есть к нему конкретные претензии, а просто потому, что так решила нейронная сеть.

CNews: Что вы предлагаете заказчикам?

Владимир Арлазаров: Банкам и страховым компаниям мы предлагаем решения по распознаванию ID-документов. Сегодня они активно переходят от старой модели обслуживания в отделении к новой, когда большая часть вопросов клиента решается без визита в офис банка. Например, предлагают открыть счет или получить кредит. С другой стороны, по закону банки должны идентифицировать гражданина, то есть он должен показать свой паспорт. И данные паспорта должны быть проверены. Наши технологии позволяют автоматизировать работу оператора и дают возможность уделять больше внимание человеку, а не заниматься заполнением различных форм. Аналогичная ситуация и в страховых компаниях – их клиенты хотят, чтобы все происходило как можно быстрее, и Центробанк идет им навстречу, сокращая сроки рассмотрения заявлений.

dsc00241.jpg
Владимир Арлазаров, к.т.н., генеральный директор Smart Engines

Одновременно растет и цена ошибки – предоставление недостоверной информации в рамках противоотмывочного или противотеррористического законодательства обходится очень дорого и даже может привести к отзыву лицензии. Кроме того, в отличие от искусственного интеллекта, который работает строго по заложенному в него алгоритму, человек может ошибаться преднамеренно. Например, в прессе уже появлялась информация о мошеннических цепочках в банках, которые позволяли получать кредиты, не предъявляя паспорт. В результате от этого страдал не только сам банк, но и обычные люди, чьи паспортные данные для этого использовались. Поэтому многие наши клиенты используют систему распознавания в качестве первого эшелона борьбы с мошенничеством.

CNews: Какие документы можно распознать?

Владимир Арлазаров: На сегодняшний день наша система поддерживает 700 типов документов 165 стран, в том числе всех стран СНГ и Европы. Обычно для каждой страны это набор документов из ID-карты, водительского удостоверения и паспорта. Для России этот список существенно шире и включает общегражданский паспорт, водительские права, СТС, ПТС, военный билет, загранпаспорт, вид на жительство, ИНН, страховой полис обязательного медицинского страхования, миграционную карту и свидетельства о рождении, браке, разводе, смерти, визу и так далее. Кроме этого мы умеем распознавать машиносчитываемую зону на стандартизованных удостоверяющих личность документах, эмбоссированные и неэмбоссированные банковские карты и 1D/2D штрих-коды.

CNews: Расскажите о вашем решении.

Владимир Арлазаров: Сегодня сканеры уже практически изжили себя – все просто фотографируют документы. А фотография – это целый набор проблем, возникающий в связи с переходом в трехмерное пространство. Если речь идет о паспорте, то он представляет собой книжку. И когда человек держит его в руке, он сгибается и выглядит на фотографии как шестиугольник. Более простые документы – права, СТС и прочее – превращаются из прямоугольника в произвольный четырехугольник. Плюс к этому фотографии, как правило, делаются при произвольном освещении. Из-за этого программы, которые умеют работать со сканами, не могут не только распознать документы на фотографиях, но даже определить, что перед ними паспорт. А наше решение изначально создавалось для того, чтобы распознавать документы вживую на видео и на фотографиях.

Наш основной продукт Smart IDReader – это система распознавания, которую можно использовать где угодно. Например, в корпоративном сервисе, который принимает и обрабатывает самые разные документы. Или при создании мобильного приложения.

Мы поддерживаем все актуальные операционные системы и процессорные архитектуры, в том числе «Эльбрус», «Байкал» и «Комдив». Таким образом, наше решение совершенно безопасно может использовать любое госведомство, например, миграционная служба, госорганизация, такая как «Почта России», или любой банк, в том числе и попавший под санкции.

dsc00301.jpg
Владимир Арлазаров: Банки должны заниматься банковской деятельностью – давать или не давать кредиты, играть на бирже, работать со вкладами. Развитие искусственного интеллекта – задача ученых

Кроме коробочного продукта, мы можем предложить еще и его доработку на заказ – добавить к стандартному пакету документов для распознавания формы, разработанные самим банком. Например, заявление по форме банка. Также мы можем автоматизировать процесс классификации документов, то есть определять по изображению, что это: договор, устав, письмо, европротокол и так далее.Часть наших проектов связана с разработкой систем искусственного интеллекта на заказ под требования заказчика.

CNews: Как это работает на практике?

Владимир Арлазаров: В качестве примера могу привести три российских банка – «Почта банк», «Альфа-банк» и «Тинькофф». Они работают в разных сегментах рынка, у них разная клиентская база и существенно отличаются методы обслуживания. Но все они – наши клиенты.

«Тинькофф» с помощью нашего решения полностью обеспечил удаленную регистрацию клиентов, возможность перевода с карты на карту, получения новых услуг и так далее – то есть, полный спектр банковских услуг, для оказания которых требуется подтвердить паспортные данные.

«Альфа-банк» пошел по другому пути — начал с VIP-сегмента, где особенно важно предложить клиентам высокое качество и оперативность обслуживания. Наша технология используется в мобильных приложениях выездных менеджеров для обслуживания премиальных клиентов банка вне отделений.

«Почта Банк» был нашим первым клиентом в банковской сфере, который решил автоматизировать сразу все 40 тысяч своих отделений. Они установили web-камеры, с помощью которых операторы фотографируют документы, а затем распознают их. Одновременно они используют наши технологии и в мобильном приложении для перевода с карты на карту, регистрации и получения новых услуг. Например, у человека уже есть кредитная карта, но он решил взять еще и потребительский кредит, для оформления которого требуется дополнительная информация – еще один документ. В этом случае он может не ходить лишний раз в банк, а просто показать этот документ мобильному приложению.Конечно, для окончательного подписания договора клиенту все-таки придется прийти в банк лично, но это будет всего один раз.

dsc01151.jpg
Владимир Арлазаров: Банкам и страховым компаниям мы предлагаем решения по распознаванию ID-документов

Аналогичным образом наши технологии используют и страховые компании. Для них важны другие документы – паспорт, водительские права, СТС, ПТС. После того, как было введено электронное ОСАГО, появилась возможность предоставить сканы своих документов через мобильное приложение или веб-клиент. При этом по закону страховая компания должна оформить электронный полис за очень короткое время. Вручную сделать это практически невозможно – например, законом не оговорено, что эти сроки могут меняться в зависимости от времени суток, а значит, если я захочу получить полис ночью, страховая компания должна мне его предоставить в те же сроки.

Кроме того, через страховые компании проходит огромное количество различных документов от самых разных клиентов, и их надо моментально обрабатывать. К сожалению, многие из них до сих пор создаются в бумажном виде – пишутся от руки. Распознать их невозможно, но мы можем проверить, есть ли в представленной пачке бумаг все, что положено. Для этого надо положить все представленные документы в сканер и получить ответ: «Комплект полный» или «Не хватает таких-то документов». Конечно, здесь могло бы пригодиться и мобильное приложение, с помощью которого человек сам сможет проверить комплектность документов. В эту сторону уверенно движутся «Ингосстрах», «Альфа-страхование» и «Ренессанс страхование».

CNews: Сколько времени занимает распознавание с помощью мобильного устройства?

Владимир Арлазаров: Смотря какого. Если взять iPhone Х, то распознавание происходит практически мгновенно. Более простым или старым телефонам потребуется больше времени – это 1-3 секунды на распознавание разворота паспорта, менее секунды на распознавание банковской карты.

CNews: Работаете ли вы с финтех-стартапами?

Владимир Арлазаров: Наверное, нас тоже можно отнести к финтеху, но только мы не считаем себя классическим стартапом. Наш основной принцип – любое взаимодействие, выгодное заказчику и нам, должно осуществляться на возмездной основе. Естественно, за исключением благотворительности. Поэтому если стартапы, которые к нам приходят, также ориентированы на создание конкурентного продукта, то нам с ними по пути. Сейчас у нас есть партнеры, вместе с которыми мы реализуем различные проекты.

CNews: Каковы особенности работы с финтех-компаниями по сравнению с классическими банками и страховыми компаниями?

Владимир Арлазаров: Смотря что вы понимаете под словом «финтех». Для нас это банк «Тинькофф» или «Рокетбанк». Они понимают, какие технологии им нужны, и быстро их внедряют. Но и классические банки и страховые в последнее время стараются от них не отставать. Может быть идей там рождается меньше, но они умеют делать качественные финансовые продукты.

Вообще, мы в России избалованы банком «Тинькофф». Услуги, которые он предлагает, значительно превосходят все, что можно найти в американских и европейских банках. Там такое только начинают предлагать финтех-стартапы.

CNews: В последний раз мы встречались с вами 2 года назад. За это время ваше решение как-то изменилось?

Владимир Арлазаров: Мы постоянно занимаемся совершенствованием нашего продукта. Если говорить про последнюю версию, то мы на 20% повысили качество распознавания. То есть точность алгоритмов постоянно растет, и сегодня, например, мы можем распознавать очень бледные изображения. Два года назад мы распознавали только основные российские документы, а сегодня, как я уже говорил, 700 типов документов из 165 стран. То есть, область применения наших технологий расширилась на рынок почти всего мира.

CNews: Ваша компания активно работает на западном рынке. У вас не возникает проблем в связи с тем, что Smart Engines – российская компания?

Владимир Арлазаров: Да, мы замечаем несколько настороженное отношение к нашей компании. Но это не так страшно – ведь мы продаем не сервисы, а решения. И заказчики могут провести оценку их безопасности. Но разрушительное влияние санкций есть, и оно довольно существенное.

CNews: А кем востребованы ваши решения в мире?

Владимир Арлазаров: Среди наших зарубежных клиентов авиакомпании, финансовые организации, эквайринговые компании, финтех.

CNews: Какие направления для дальнейшего развития вы видите?

Владимир Арлазаров: Думаю, в ближайшем будущем будет расти потребность в распознавании документов формата А4 с помощью мобильного телефона. Например, формы 2-НДФЛ.

Вторая тенденция – распознавание документов при низком уровне освещения. Уже сегодня мы предлагаем пользователям распознавать банковские карты, например, во время поездки в такси по ночной Москве – там достаточно темно и сильно трясет. И мы намерены двигаться дальше в этом направлении. Заставлять пользователя «не дышать» во время процесса распознавания документов на мобильном телефоне – это неправильно.

Думаю, с развитием цифровизации для нас появится еще больше работы: это может быть распознавание этикеток, маркировки на деталях, выкладки товара и так далее. Постепенно подобными технологиями начнут интересоваться все отрасли, просто банки и страховые компании сделали это раньше других.

CNews: Крупные банки, как правило, сами занимаются разработкой. Вы видите в них конкурентов?

Владимир Арлазаров: Банки должны заниматься банковской деятельностью – давать или не давать кредиты, играть на бирже, работать со вкладами. Развитие искусственного интеллекта – задача ученых. И в России есть как минимум 2 команды, которые занимаются распознаванием документов уже много лет – это ABBYY и мы.

Один из основателей нашей компании начал заниматься искусственным интеллектом еще во времена Советского Союза – тогда это были первые шахматные программы, которые обыгрывали чемпионов мира. Наши сотрудники работают в академических институтах РАН, преподают в ВУЗах, выступают на ведущих международных конференциях и публикуют от 30 до 40 научных работ в год. То есть мы являемся не просто коммерческой компанией. У нас есть серьезная научная база, в основе которой годы и годы работы. Непонятно, зачем нужно заниматься этой деятельностью банкам и страховым компаниям. Финансовые организации должны работать в той области, где являются профессионалами.

CNews: В чем принципиальное отличие обучения искусственного интеллекта для распознавания документов от других задач?

Владимир Арлазаров: Специалисты, которые разбираются в распознавании букв, умеют создавать алгоритмы распознавания букв. Для того чтобы переключиться на другую задачу, им надо хорошо изучить новую предметную область. А это требует и времени, и дополнительных затрат. Впрочем, так происходит в любой сфере – педиатр сможет лечить пожилых людей, но после того, как пройдет переобучение.

CNews: Почему вы решили заняться поддержкой разных аппаратных платформ?

Владимир Арлазаров: Это улучшает качество программы. Мы приучаем разработчиков внимательно проверять код. У каждой архитектуры есть свои особенности, и код, который хорошо работает на АРМ, может медленно работать на X86. Мы изначально решили разрабатывать многоплатформенные и платформонезависимые решения. Так, наши алгоритмы оптимизированы для «Эльбрус», SPARC, MIPS, ARM, x86 и совместимы с операционными системами iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux, Windows, macOS и Solaris. Платформонезависимость означает, что качество распознавания не зависит от используемой платформы, а быстродействие определяется доступными вычислительными ресурсами.

Каждая из платформ накладывает ограничения на алгоритмы и способы программирования. Например, на «Эльбрусе», в силу его особенностей, программирование должно вестись очень аккуратно, потому что у него компилятор выполняет функцию распараллеливания по вычислительным устройствам. И это надо учитывать.

Ошибки, которые не проявляются на одной архитектуре, обязательно станут очевидны на другой. Например, когда мы переносили и оптимизировали кодовую базу на «Эльбрус», мы ускорились на всех платформах, потому что нашли узкие места. То же происходит и с MIPSом, который мы сейчас осваиваем. Каждый раз мы получаем новые знания, с помощью которых делаем наш продукт лучше и лучше.

CNews: Сейчас в российских банках активно внедряется биометрия. Ваша компания как-то собирается участвовать в этом проекте?

Владимир Арлазаров: Все зависит от желания заказчика. Мы не стремимся участвовать в этом по одной простой причине: если произойдет утечка паспортных данных – это неприятно, но в крайнем случае человек всегда сможет его поменять. Если же кто-то украдет биометрическую информацию, например, лицо, то не очень понятно, что делать в этом случае. Пластику лица? Я думаю, что риски слишком высоки, а их последствия пока непонятны. И мы пока не готовы этим заниматься.

Вернуться на главную страницу обзора