Москва строит нейросеть для проверки документов мигрантов на основе Ubuntu Linux и PostgreSQL

Московский многофункциональный миграционный центр опубликовал тендер на разработку нейросети для проверки электронных версий документов иностранных граждан. На работы выделено 144 млн руб.



ИИ для миграционного центра

Как выяснил CNews, московский многофункциональный миграционный центр разрабатывает систему на основе искусственного интеллекта (ИИ) для автоматизации процессов предварительной проверки электронных версий документов иностранных граждан.

Информацию об этом можно найти в опубликованном на сайте госзакупок техническом задании. Тендер был опубликован на торговой площадке 28 августа 2025 г. Заявки на участие в электронном аукционе принимаются до 15 сентября. Итоги выбора поставщика намечены на 24 сентября. На работы выделено 144 млн руб.

Система предназначена для полностью автоматической проверки комплектов документов, направляемых иностранными гражданами через интернет и другие каналы связи. Она будет обрабатывать сканированные копии документов, необходимых для получения разрешения на временное проживание, вида на жительство, гражданства России, статуса носителя русского языка, а также для прохождения обязательной дактилоскопической регистрации, медицинского освидетельствования и подачи уведомлений о трудовой деятельности.

Ключевыми целями проекта являются исключение участия оператора в процессе проверки, расширение перечня онлайн-услуг и повышение скорости и качества обработки документов.

Система будет интегрирована с существующей информационной системой многофункционального миграционного центра по электронной проверке документов (ИС ЭПД) через API-интерфейсы.

Подробности разработки

Архитектура системы построена по трехуровневому принципу и включает уровень хранения данных, уровень бизнес-логики и уровень представления.

Она состоит из шести основных подсистем: загрузки графических данных, распознавания текста, интеллектуальной проверки документов, формирования и отображения результатов, хранения данных и взаимодействия с внешними системами.

Как указано в техническом задании, классификация документов должна осуществляться с точностью не менее 98%, распознавание текста — также не менее 98%.

Для обучения нейронных сетей требуется создать аннотированную выборку из не менее чем 8000 уникальных изображений для каждого типа документа. Производительность системы должна обеспечить обработку до 250 тыс. документов в сутки с временем отклика не более 10 секунд в штатном режиме и 180 секунд в пиковой нагрузке.

Работы выполняются в два этапа. На первом этапе создается основная функциональность системы, включая механизмы взаимодействия, распознавания, проверки и обучения нейросетей на 12 основных типах документов, таких как миграционная карта, заграничные паспорта различных стран, медицинские заключения и другие.

На втором этапе планируется дообучение системы для работы с дополнительными типами документов, включая патенты, полисы ДМС, свидетельства о рождении и иные правовые документы.

На чем создается система

В качестве серверной операционной системы планируется использование Windows Server 2012 и выше или Ubuntu Server 16.04.7 и выше. Управление базами данных будет осуществляться с помощью СУБД PostgreSQL 16 или аналогичных решений, обеспечивающих реляционную или объектно-реляционную модель данных, поддержку многопроцессорной архитектуры и механизмов контроля целостности.

Клиентская часть системы будет функционировать в веб-браузере «Яндекс Браузер» версии 22.7.3 и выше, что соответствует модели «тонкого клиента». Для разработки программных решений предполагается использование языков программирования высокого уровня, включая Java 8 и C#.

Каждая подсистема реализует строго определенный функционал, начиная от конвертации файлов различных графических форматов (PNG, JPEG, BMP, TIFF, PDF) в единый формат и заканчивая комплексным анализом документов с использованием статистических методов и нейросетевых моделей архитектуры трансформеров с механизмами внимания.

Для обеспечения взаимодействия с внешними системами, в частности с ИС ЭПД, разрабатываются API-интерфейсы, использующие протоколы HTTP/HTTPS и формат обмена данными XML. Интеграционные решения предусматривают возможность использования веб-сервисов или обмена структурированными файлами специализированных форматов.

Учет мигрантов через мобильное приложение

С 1 сентября 2025 г. в Москве и Московской области вводится обязательное использование приложения «Амина» для мигрантов. Этот цифровой сервис предназначен для иностранных граждан, прибывающих в Россию без визы для трудовой деятельности.

Приложение будет обязательным для трудовых мигрантов из Узбекистана, Таджикистана, Киргизии, Армении, Казахстана, Грузии, Азербайджана, Молдовы и Украины. Для прохождения миграционного учета в этом регионе необходимо будет использовать «Амина».

С 1 сентября 2025 г. мигранты должны самостоятельно установить это приложение. Для авторизации в приложении потребуется действующая карта иностранного гражданина, которую можно оформить в ММЦ Сахарово. Если карта будет утеряна, авторизация возможна по паспортным данным.