«Дочка» Росреестра отдаст в три раза больше денег за улучшение своего ИИ, чем за его создание
Роскадастр выделил 99 млн руб. на работы по развитию подсистемы подсистема машинного обучения ФГИС ЕГРН. Подрядчикам предстоит работать на Python и PostgreSQL.
ИИ для регистрации недвижимости
Как стало известно CNews, Роскадастр, компания учрежденная Росреестром, выделил 99 млн руб. на развитие искусственного интеллекта в системе, автоматизирующей работу ведомства. Под развитие попала модульная подсистема машинного обучения (МСМО) ФГИС ЕГРН. Предназначена она для автоматизации процессов поддержки принятия решений при осуществлении государственной регистрации прав на недвижимое имущество и сделок с ним.
Для поиска специалистов по машинному обучению 2 ноября 2024 г. Роскадастр опубликовал тендер на сайте госзакупок. Выборы подрядчика проведут в формате аукциона заявки на который желающие смогут подать до 18 ноября. Итоги конкурса подведут 26 ноября 2024 г.
Работы по созданию МСМО Роскадастр проводил в октябре 2021 г. Тогда на разработку служба выделила 36 млн руб. Контракт заключили с компанией ООО «Биорг», при этом начальная сумма закупки снизилась до 30 млн. Сама компания занимается разработкой ИИ-систем для оцифровки документов, распознавания изображений и идентификации личности.
ФГИС ЕГРН – это Федеральная государственная информационная система «Единый государственный реестр недвижимости». Предназначена для ведения учета объектов недвижимости, прав на них и обеспечения доступа к информации о них.
Десятки миллионов на доработку
Как указано в документах, приложенных к тендеру, на данный ИИ Роскадастра способен получать и верифицировать электронные пакеты документов в форматах PDF и XML, связанных с проведением УРД в ФГИС ЕГРН. Система выделяет страницы из PDF, нормализует их геометрию, сегментирует и преобразует печатный текст в машиночитаемый формат.
Также ИИ классифицирует пакеты и файлы по видам документов, извлекает ключевые сущности и устанавливает связи между ними. Также может осуществляться форматно-логический контроль данных, включая внутренние кросс проверки и сопоставления с данными ФГИС ЕГРН. И формировать экспертные заключения с детальной информацией о проверках и проектом решения для государственного регистратора прав.
В рамках текущего тендера Роскадастр планирует повысить определения системой видов учетно-регистрационных действий, соответствующих каждому поступившему пакету документов, точность распознавания текста в документах и их вида. Планируется и расширение состава видов документов, к которым система должна относить каждый содержащийся в поступившем пакете документ.
Подрядчику также предстоит реализовать диалоговый режим работы системы, разработать функции сравнения подписей и печатей, предварительной валидации состава и содержания скан-образов документов в поступающих пакетах и снизить время обработки информации.
Про технологический стек ИИ
Основу математического обеспечения системы должны составлять искусственные нейронные сети — математические модели, основанные на принципах организации и функционирования биологических нейронных сетей (например: «Алиса» («Яндекс»), «Маруся» (VK), Siri (Apple)). Эти модели предназначены для решения различных специфических (служебных и прикладных) задач в рамках реализации назначения системы. Также в состав математического обеспечения входят методы работы с ИНС, включая техники сжатиz моделей, дистилляции знаний и другие.
Основные работы подрядчику придется выполнять на языке программирования Python, PostGres SQL (процедурное расширение SQL, используемое в СУБД PostgreSQL).