Россияне создали систему, способную распознавать паспорта со всего мира
Компания Smart Engines представила систему Hieroglyph, которая поддерживает 38 языков и умеет распознавать удостоверения личности 55 стран. Разработчик намерен продавать продукт в Западной Европе и США, первые продажи ожидаются к концу 2019 г.
Система Hieroglyph
Российская компания Smart Engines создала систему искусственного интеллекта, которая способна распознавать удостоверяющие личность документы со всей планеты. Разработка, представленная на Всемирном мобильном конгрессе (MWC) 2018 в испанской Барселоне, получила название Hieroglyph. Система создавалась на протяжении 2017 г.
В настоящий момент Hieroglyph способна распознавать паспорта, ID-карты и водительские удостоверения, используемые более чем в 55 странах мира. Система поддерживает 38 языков, среди которых представлены почти все европейские, в том числе английский, немецкий, французский, испанский и португальский. Hieroglyph также владеет армянским и грузинским, несмотря на то, что разработчики отмечают их визуальную сложность.
Как сообщил гендиректор Smart Engines Владимир Арлазаров, на мировом рынке компания надеется реализовать продукт прежде всего в странах Западной Европы и США. Технически это уже возможно, поскольку система поддерживает все необходимые языки. Потенциальная пользовательская аудитория Hieroglyph насчитывает порядка 1,5 млрд человек.
В Smart Engines надеются, что уже к концу 2019 г. за пределами России начнут продаваться решения, созданные на базе Hieroglyph. Как поясняют в компании, при работе с крупными европейскими и американскими заказчиками между заключением первого контракта и завершением сделки обычно проходит 1,5-2 года.
Совместимость системы
Hieroglyph подходит для работы с архитектурами «Эльбрус», SPARC, ARM и x86. В списке поддерживаемых ОС присутствуют iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux, в том числе Astra Linux и «Атликс», Windows, macOS и Solaris.
![](http://filearchive.cnews.ru/img/news/2018/03/14/pasporta600.jpg)
Система способна обрабатывать различные изображения распознаваемых документов, в том числе видеозаписи, фотографии, сканы самих документов и сканы их копий. Фото и видеосъемку документов можно осуществлять с помощью телефонов, планшетов и веб-камер. Скорость распознавания зависит от того, какие вычислительные ресурсы доступны на устройстве.
Используемые технологии
Hieroglyph создана на базе собственных разработок Smart Engines в области распознавания изображений, в основе системы лежат глубокие целочисленные нейронные сети. Чтобы они работали быстрее, разработчики применили сепарированную архитектуру сверточных слоев и 8-битную модель вычислений. По словам создателей Hieroglyph, это решило обычную для машинного обучения проблему вычислительных накладок.
Большая часть функциональности платформы дает возможность обрабатывать информацию в 8-битной целочисленной арифметике. Таким образом, ответ глубоких нейронных сверточных сетей можно вычислять в восьмибитном тракте, поясняют разработчики.
Для экономии вычислительных ресурсов Hieroglyph создает компактные описания изображений, представленные в виде векторов многомерного метрического пространства. В этих описаниях отсеиваются искажения, которые являются следствием разной яркости освещения и ракурса съемки. Разработчики отмечают, что это немаловажно, когда распознавание документа производится в видеопотоке с мобильного устройства и при освещении, интенсивность которого невозможно узнать заранее.
Демонстрация распознавания документов с помощью Hieroglyph
В Hieroglyph применяется технология синтеза выборок для обучения нейронных сетей, которая дает возможность добавить распознавание нового вида документов. Для этого понадобится всего два изображения этого документа: на одном нейросеть научится его распознавать, а с помощью второго можно будет проверить результат.
Другие результаты Smart Engines
По итогам 2017 г. доход Smart Engines от распознавания документов в России превысил 1 млн евро, что в четыре раза больше аналогичного показателя за предыдущий год. Компания отмечает, что 2017 г. стал вторым полным годом ее работы в России. Основным источником поступлений в этот период стала система Smart IDReader, распознающая различные российские документы, в том числе паспорт, водительские удостоверения и банковские карты.
Решения компании находят применение в сервисах, где необходима удаленная идентификация и верификация пользователя, то есть в области финансовых технологий и транспорта, а также в банковском деле, страховании и шеринговых проектах. Технологии Smart Engines используют «Аэрофлот», Тинькофф банк, Альфа-банк, Почта банк, QIWI, «Ренессанс страхование» и СКБ «Контур».
Несколько фактов о Smart Engines
Smart Engines — российский разработчик систем обработки изображений и распознавания символов в видеопотоке. Компания была основана в 2010 г., но до 2015 г. работала только на зарубежном рынке. Ее штат насчитывает более 45 сотрудников из России и других стран, среди них 16 имеют ученую степень.
Генеральным директором Smart Engines является Владимир Викторович Арлазаров. Директором по научной части и соучредителем Smart Engines выступает Владимир Львович Арлазаров, сооснователь еще нескольких российских ИТ-компаний. В частности, он является основателем компании Cognitive Technologies, где с 1991 г. по 2008 г. занимал пост генерального директора.
![](https://static.cnews.ru/img/articles/2024/12/13/5384197704533533204_600.jpg)
Технологии Smart Engines используют компании SITA (швейцарский разработчик ИТ для авиации), MITEK Systems (американский разработчик средств идентификации для мобильных ОС), Jumio (американский разработчик инструментов идентификации для платежных систем), а также австрийская компания-интегратор S&T System Integration & Technology Distribution и японская AlterKnowledge.
В декабре 2016 г. система распознавания документов Smart IDReader была внесена в Реестр отечественного ПО.