Спецпроекты

На страницу обзора
Аналитика в госсекторе: пришло время видеть будущее
Государственный сегмент – главный потребитель аналитических решений в мире. Это неудивительно: именно госстуктуры аккумулируют самые большие объемы данных, анализ которых позволяет не только выявлять закономерности общественной жизни, но и прогнозировать изменения ее процессов.

Заявления, жалобы, письма, запросы, обращения граждан – с появлением электронных форм взаимодействия общества и государства объем информации, собираемой госструктурами, многократно увеличился. К непрерывному «входящему трафику», содержащему информацию обо всех объектах и субъектах страны (и без того внушительному): планам, отчетам, предложениям, – сегодня добавляются и сведения, почерпнутые из соцсетей, блогов, форумов. Возросли потоки данных и с вводом электронного документооборота и началом процесса оцифровки бумажных документов. Практически все ИС, активно внедряемые сейчас в органах госвласти, имеют встроенные аналитические модули, которые позволяют формировать отчеты – дополнительный источник данных.

Big Data: как извлечь пользу?

Почти три четверти этой информации, как правило, слабо структурировано и неупорядоченно, половина представлена в виде текстов, аудио/видео файлов. Объем данных постоянно и с большой скоростью возрастает. Это то, что принято называть Big Data (Большие Данные), и для работы с Большими Данными необходим принципиально новый подход, сочетающий внедрение на первом этапе технологий сбора, очистки, структурирования и хранения данных (решения класса Data Quality, Data Integration/Federation, Text Analytics) и на последующих этапах - использование инструментов высокопроизводительной аналитики и систем отчетности. Для российского госсектора технологии Больших Данных пока в новинку, однако именно они дают возможность государству трансформировать многие накопленные терабайты данных в ценные сведения о своих гражданах.

Есть как минимум две области, в которых использование решений для обработки и анализа Больших Данных особенно наглядно и позволяет выйти на совершенно новый уровень понимания общественных явлений: это анализ интернет-ресурсов и потоков текстовых документов. Специализированные системы позволяют выявлять тенденции в обществе, пресекать случаи мошенничества при получении социальных пособий и государственных выплат, обнаруживать факты недекларирования доходов налогоплательщиков, контролировать денежные потоки, процессы, происходящие на государственной границе и таможне, решать вопросы национальной безопасности. Кроме этого, анализируя мнения населения с помощью инструментов для обработки Больших Данных, чиновники получают сведения о реальном качестве предоставляемых госуслуг.

Аналитика на госслужбе

Эффективная работа с Большими Данными делает возможным экономическое моделирование и прогнозирование. Например, можно предсказать уровень безработицы в стране или, как в Канаде, сформировать программу здравоохранения. Чтобы исследовать причины характерных болезней граждан, выявить факторы, влияющие на уровень заболеваемости, и оценить качество медпомощи в стране, канадским чиновникам было необходимо обработать – агрегировать, подготовить и проанализировать – данные за 17 лет. Специалисты компании SAS – по оценкам авторитетных агентств, таких, как Forrester Research, IDC, мирового лидера в производстве аналитических систем – построили аналитическую систему, с помощью которой государство смогло на основе этих данных разработать новые инициативы по развитию системы здравоохранения.

Показателен и опыт построения централизованной системы обращения граждан для чиновников Гонконга. Каждый год с помощью системы обрабатывается около 100 тыс. электронных писем и 2,5 млн звонков от жителей страны. В результате государство получает ценнейшую информацию о настроениях граждан, их мнениях по актуальным общественных вопросам, моделях поведения, выявляет тенденции в работе госучреждений и т.д.
Аналитические продукты для работы с Big Data успешно применяются для решения специализированных задач отдельных госструктур. Например, на таможне в Южной Корее и Индии с их помощью обнаруживают нелегальные потоки экспорта и импорта. Министерство финансов Германии управляет бюджетами всех уровней. Пенсионный департамент Великобритании применяет решения для анализа Больших Данных, в том числе, и для выявления фактов неправомерного получения социальных пособий, а США использует их для обнаружения неплательщиков налогов. Система, позволяющая определять неправомерное возмещение экспортного НДС при помощи аналитических методов, внедрена в Бельгии. Результат уже налицо: если раньше бюджет терял на неправомерном возмещении примерно 1 млрд евро в год, то теперь – почти в 30 раз меньше: около 35 млн евро.

Не только цифры

Одной из существенных сложностей анализа информации в госсекторе по сравнению, например, с коммерческими организациями, является то, что данные поступают в виде слабоструктурированной, текстовой информации, причем эти текстовые документы различны по объему, жанру и тематике — собственно, в этом заключается особенность Больших Данных. Текстовых документов не десятки и даже не сотни тысяч - их миллионы. Вопрос, как "прочитать" весь этот объем информации, увидеть главное, найти закономерности, причем оперативно, на первый взгляд кажется неразрешимым. На помощь чиновникам приходят инструменты мониторинга и интеллектуального текстового анализа. Так, в Швеции правоохранительные органы собирают и анализируют все сообщения, появляющиеся в интернете, которые так или иначе касаются темы наркотиков. Далее на основе полученных данных госслужбы выявляют схемы провоза наркотических средств через аэропорты и составляют инструкции, помогающие пресекать подобные противоправные попытки.

В мировой практике для выявления мошенничества в налоговой и пенсионной сферах применяют antifraud-решения, которые позволяют выявлять подозрительных граждан и целые группы лиц, а также обнаруживать совершаемые ими операции. Информация о предполагаемых преступниках поступает разнородная: об их перемещениях по стране и миру, о наличии имущества в собственности, состоянии счета, всевозможных платежах и отчислениях, а также о социальных связях (для этого устанавливаются взаимодействия с родственниками, одноклассниками, соседями, коллегами, а также фигурантами преступлений). На помощь расследованию приходит система анализа социальных сетей, которая позволяет понять, общается ли предполагаемый преступник с подозрительными личностями, поддерживает ли криминальные контакты, а система интеллектуального анализа текста дает оценку настроения и намерений наблюдаемого гражданина.

Вместо тысячи слов

Одно из требований к современной аналитической системе – простота и доступность для большего количества пользователей. Польза от внедрения высокотехнологичных решений в госсекторе может существенно снижаться, если результаты проведенных исследований будут доступны слишком ограниченному числу пользователей. Но чтобы предоставить их всем заинтересованным лицам, потребуется перевести специфические данные в привычный в стенах данного учреждения формат, а на это нужно время, ресурсы и организация дополнительных процессов.

Аналитика должна двигаться в сторону демократизации, считают эксперты SAS. Доступ к результатам исследований нужен не столько ученым или ИТ-специалистам, сколько чиновникам, не обладающим глубокими знаниями в математике и программировании. Чтобы сделать результаты работы с Big Data понятными и наглядными, в последнее время всё чаще используют специальные средства визуализации. Образы и графические картинки позволяют быстрее донести смысл, чем данные, представленные в текстовом формате, – именно этим объясняется любовь пользователей к инфографике. Несмотря на то, что при графическом отображении информации задействуется меньшее количество печатных символов, оно дает большее представление о корреляции явлений, их влиянии друг на друга, чем перечисление и словесное описание, каким бы подробным оно ни было.

Российская аналитика: процесс пошел

К инструментам, нацеленным на выявление закономерностей уже произошедших событий (так называемая реактивная аналитика), в госсекторе уже успели привыкнуть. Они позволяют отвечать на вопросы о том, почему произошло то или иное явление, сколько раз оно случалось, где и в чем был источник проблемы. Однако сегодня ИТ предлагают решения более глубоких исследовательских задач. Речь о так называемой проактивной аналитике, которая, собственно, и есть цель внедрения аналитических решений. Она ориентируется на предсказание социально-экономических явлений, делает возможным предвосхищение и прогноз событий и дает доступ к информации, ценность которой значительно выше: «Как будут развиваться события?», «Что случится при изменении какого-либо параметра?», «Как долго сохранится тенденция?» и т. д.

В сторону таких высокопроизводительных аналитических решений, которые в России уже опробованы финансовыми организациями и телеком-компаниями, госсектор смотрит все более внимательно. Пока подобный интерес характерен в большей степени для федеральных ведомств, накопивших максимальные объемы данных, но и органы местного самоуправления, как уверены эксперты, скоро начнут внедрения платформ для углубленной аналитики.
Все предпосылки для этого есть. Оборудованием госучреждения обеспечены, системы учета и электронного документооборота внедрены, СМЭВ запущена, средства описательной аналитики имеются – первый этап автоматизации можно считать завершенным. Если перевести технические показатели в финансовые, эффект от проектов очевиден, и чиновников это воодушевляет.

Технологии SAS уже давно используется в крупных российских госкорпорациях, которые всерьез занимаются решением комплексных аналитических задач и извлекают из этого ощутимую финансовую выгоду. Мы видим в этом подтверждение готовности и зрелости госсектора в области использования полноценных аналитических платформ.

Полтора года назад в российском офисе SAS работа с государственными организациями была выделена в отдельное направление. Создание решений, нацеленных на прогнозирование, выявление скрытых взаимозависимостей и связей явлений, – логичный этап развития аналитики в органах власти. Ситуационные и аналитические центры или подразделения, которые активно формируются в секторе госуправления, будут решать «тонкие» аналитические задачи, например, для составления прогноза уровня безработицы с применением оценки настроений граждан или определения возможного дохода бюджета после принятия законодательных актов.


Мария Чимиричкина

Интервью обзора

Рейтинги

Крупнейшие поставщики BI-решений в России 2013
Название  Выручка по направлению BI, 2012, тыс. руб.(с НДС)
1 Прогноз 3 861 020
2 Ай-Теко 290 020
3 Техносерв Консалтинг 240 000
Подробнее