Ученые Smart Engines создали ИИ для распознавания документов, который превосходит человека по производительности в 2,5 тыс. раз
Российская компания Smart Engines сообщила о прорыве в области распознавания документов. Ученые создали ИИ, который способен вводить данные из паспорта России с производительностью 125 изображений в секунду на сервере без GPU. При этом новое поколение алгоритмов решает задачу с более высокой точностью: число ошибок при распознавании паспортов снизилось на 26%, особенно на изображениях низкого качества. Функциональность вошла в новую версию программного решения для считывания и проверки подлинности удостоверений личности Smart ID Engine 2.7. Об этом CNews сообщили представители Smart Engines.
«Наша цель – повысить производительность труда и полностью исключить человека из процесса ввода данных. Сейчас мы преодолели новый и важный рубеж – за одну секунду наша система распознает 125 изображений паспорта без использования GPU, что эквивалентно 10 млн паспортов в сутки на одном сервере. Если у квалифицированного оператора на ввод данных из разворота паспорта уходит в среднем 20 секунд, то система Smart ID Engine 2.7 за это время способна ввести данные из 2,5 тыс. разворотов», – сказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
Особое внимание в обновлении уделено повышению качества распознавания рукописного текста даже в самых проблемных случаях. ИИ успешно справляется с распознаванием трудночитаемых слов, включая имена собственные. Точность считывания рукописных полей и штампов о прописке выросла на 11%.
В новой версии также повышено качество распознавания текста на других документах России. Например, в картах иностранного гражданина удалось сократить ошибки распознавания на 52%, в разрешении на временное проживание – на 22%, полисе обязательного медицинского страхования (ОМС) – на 15%, свидетельствах о рождении – на 11%, СНИЛС – на 10%, и др.
Технология уже интегрирована в ключевые отрасли: ее применяют 10 из 13 системно значимых банков, «большая тройка» сотовых операторов, Федеральная налоговая служба (ФНС), РЖД в кассах для продажи билетов, «Шереметьево» – в автогейтах.

Программный продукт Smart ID Engine включен в Реестр российского программного обеспечения Минцифры России и относится к классу систем ИИ. Система доступна для интеграции в серверные, десктопные, мобильные и веб-приложения, а также совместима со всеми актуальными ОС, включая отечественные дистрибутивы Linux, ОС «Аврора», «Эльбрус» и «Комдив».
Рекордная скорость распознавания документов была достигнута при тестировании на серверном оборудовании с 64-ядерным процессором AMD Ryzen Threadripper Pro 7985WX без использования GPU. ИИ извлекал данные из всех текстовых полей основного разворота паспорта, фрагментов с подписями и фотографией владельца, а также машиночитаемой зоны (МЧЗ). Тестирование проводилось на синтезированных изображениях паспортов России из открытого датасета MIDV-2020.