Минцифры создает национальное озеро данных
Минцифры начало разработку проекта «ГосДата.хаб», который объединит потоки обезличенных данных госорганов. Национальное озеро данных позволит систематизировать хранение и обработку данных для государственных аналитических сервисов. Реализация проекта намечена на 2022-2024 гг. В опытную эксплуатацию система будет запущена в 2023 г.
Хранение и обработка госданных будет систематизирована
Минцифры приступило к разработке «ГосДата.хаба». Это проект, объединяющий потоки обезличенных данных госорганов, рассказали CNews в Минцифры.
Благодаря автоматизированному формированию документов по заданным алгоритмам, национальное озеро данных позволит систематизировать хранение и обработку данных для государственных аналитических сервисов.
Кроме того, согласно заявлению Минцифры, это даст возможность упростить подготовку отчетов госорганам и бюджетным организациям. Все собранные данные будут попадать в озеро в обезличенном виде, их деперсонализация будет происходить на стороне поставщика данных.

Глава Минцифры Максут Шадаев подчеркнул, что «ГосДата.хаб» объединит обезличенные данные органов власти всех уровней и позволит формировать расширенную аналитику. Сначала будут запущены сервисы аналитики для ИТ и связи, подчеркнул министр. Обмен данными будет двухсторонним: обезличенные данные государственных датасетов сможет использовать и бизнес для развития собственных решений.
Сначала наборы данных из «ГосДата.хаба» будут доступны для госорганов. В перспективе доступ к ним также получит бизнес. Для этого будет создан датамаркет – один из публичных контуров Национальной системы управления данными (НСУД).
Направления проекта
Проект будет развиваться в трех ключевых направлениях. Первое - переход от разрозненной отчетности государственных ведомств к автоматизированной интегрированной системе сбора обезличенных данных из государственных информационных систем. Второе - создание дата-сервисов и использование государственных данных для анализа состояния отраслей экономики и социальной сферы. Третье - предоставление обезличенных государственных данных бизнесу и гражданам, в первую очередь – разработчикам решений на основе искусственного интеллекта.
«В рамках развития аналитических сервисов единой информационной платформы Национальной системы управления данными будут сформированы бизнес-процессы по подключению поставщиков данных к аналитическому хранилищу, организован полный цикл сбора, обработки, нормализации данных и их использования для решения прикладных бизнес-задач. Кроме того, в рамках проекта запланировано развитие компетенций обработки больших данных внутри государственного сектора, а также методологическая поддержка разработки показателей и метрик на основе данных», – отметил директор ФГАУ НИИ «Восход» Максим Рымар.
Основной площадкой реализации национального озера данных будет ФГАУ НИИ «Восход». Реализация проекта намечена на 2022-2024 гг. В опытную эксплуатацию система будет запущена в 2023 г.
Ведущий инженер CorpSoft24 Михаил Сергеев сказал CNews, что проект поможет автоматизировать и систематизировать отчетность (в данный момент различные ведомства создают и отправляют отчеты в разных форматах). Этот огромный массив данных позволит анализировать состояние различных отраслей экономики и сформировать расширенную аналитику.
Минцифры сообщает, что изначально собранные данных будут доступны только для госорганов, однако в перспективе доступ к ним также получит бизнес. То есть «ГосДата.хаб» будет делиться своими данными, а частный бизнес своими, это позволит более эффективно планировать и использовать ресурсы, отметил Сергеев.