Аналитика в госсекторе: пришло время видеть будущее
Государственный
сегмент – главный потребитель аналитических решений в мире. Это неудивительно:
именно госстуктуры аккумулируют самые большие объемы данных, анализ которых
позволяет не только выявлять закономерности общественной жизни, но и
прогнозировать изменения ее процессов.
Заявления, жалобы,
письма, запросы, обращения граждан – с появлением электронных форм
взаимодействия общества и государства объем информации, собираемой
госструктурами, многократно увеличился. К непрерывному «входящему трафику»,
содержащему информацию обо всех объектах и субъектах страны (и без того
внушительному): планам, отчетам, предложениям, – сегодня добавляются и сведения,
почерпнутые из соцсетей, блогов, форумов. Возросли потоки данных и с вводом
электронного документооборота и началом процесса оцифровки бумажных документов.
Практически все ИС, активно внедряемые сейчас в органах госвласти, имеют
встроенные аналитические модули, которые позволяют формировать отчеты – дополнительный
источник данных.
Big Data: как извлечь пользу?
Почти три четверти
этой информации, как правило, слабо структурировано и неупорядоченно, половина
представлена в виде текстов, аудио/видео файлов. Объем данных постоянно и с
большой скоростью возрастает. Это то, что принято называть Big Data (Большие Данные), и
для работы с Большими Данными необходим принципиально новый подход, сочетающий
внедрение на первом этапе технологий сбора, очистки, структурирования и хранения
данных (решения класса Data Quality, Data Integration/Federation, Text Analytics) и на
последующих этапах - использование инструментов высокопроизводительной
аналитики и систем отчетности. Для российского госсектора технологии Больших
Данных пока в новинку, однако именно они дают возможность государству
трансформировать многие накопленные терабайты данных в ценные сведения о своих
гражданах.
Есть как минимум
две области, в которых использование решений для обработки и анализа Больших
Данных особенно наглядно и позволяет выйти на совершенно новый уровень
понимания общественных явлений: это анализ интернет-ресурсов и потоков
текстовых документов. Специализированные системы позволяют выявлять тенденции в
обществе, пресекать случаи мошенничества при получении социальных пособий и
государственных выплат, обнаруживать факты недекларирования доходов
налогоплательщиков, контролировать денежные потоки, процессы, происходящие на
государственной границе и таможне, решать вопросы национальной безопасности.
Кроме этого, анализируя мнения населения с помощью инструментов для обработки Больших
Данных, чиновники получают сведения о реальном качестве предоставляемых
госуслуг.
Аналитика на
госслужбе
Эффективная работа
с Большими Данными делает возможным экономическое моделирование и прогнозирование.
Например, можно предсказать уровень безработицы в стране или, как в Канаде, сформировать
программу здравоохранения. Чтобы исследовать причины характерных болезней
граждан, выявить факторы, влияющие на уровень заболеваемости, и оценить
качество медпомощи в стране, канадским чиновникам было необходимо обработать –
агрегировать, подготовить и проанализировать – данные за 17 лет. Специалисты
компании SAS – по оценкам авторитетных агентств, таких, как Forrester Research, IDC, мирового лидера в
производстве аналитических систем – построили аналитическую систему, с помощью
которой государство смогло на основе этих данных разработать новые инициативы
по развитию системы здравоохранения.
Показателен и опыт
построения централизованной системы обращения граждан для чиновников Гонконга.
Каждый год с помощью системы обрабатывается около 100 тыс. электронных писем и
2,5 млн звонков от жителей страны. В результате государство получает ценнейшую
информацию о настроениях граждан, их мнениях по актуальным общественных
вопросам, моделях поведения, выявляет тенденции в работе госучреждений и т.д.
Аналитические продукты для работы с Big Data успешно
применяются для решения специализированных задач отдельных госструктур.
Например, на таможне в Южной Корее и Индии с их помощью обнаруживают
нелегальные потоки экспорта и импорта. Министерство финансов Германии управляет
бюджетами всех уровней. Пенсионный департамент Великобритании применяет решения
для анализа Больших Данных, в том числе, и для выявления фактов неправомерного
получения социальных пособий, а США использует их для обнаружения
неплательщиков налогов. Система, позволяющая определять неправомерное
возмещение экспортного НДС при помощи аналитических методов, внедрена в
Бельгии. Результат уже налицо: если раньше бюджет терял на неправомерном
возмещении примерно 1 млрд евро в год, то теперь – почти в 30 раз меньше: около
35 млн евро.
Не только цифры
Одной из
существенных сложностей анализа информации в госсекторе по сравнению, например,
с коммерческими организациями, является то, что данные поступают в виде слабоструктурированной,
текстовой информации, причем эти текстовые документы различны по объему, жанру
и тематике — собственно, в этом заключается особенность Больших Данных.
Текстовых документов не десятки и даже не сотни тысяч - их миллионы. Вопрос,
как "прочитать" весь этот объем информации, увидеть главное, найти
закономерности, причем оперативно, на первый взгляд кажется неразрешимым. На
помощь чиновникам приходят инструменты мониторинга и интеллектуального
текстового анализа. Так, в Швеции правоохранительные органы собирают и
анализируют все сообщения, появляющиеся в интернете, которые так или иначе
касаются темы наркотиков. Далее на основе полученных данных госслужбы выявляют
схемы провоза наркотических средств через аэропорты и составляют инструкции,
помогающие пресекать подобные противоправные попытки.
В мировой практике для выявления мошенничества в налоговой и пенсионной сферах применяют antifraud-решения, которые позволяют выявлять подозрительных граждан и целые группы лиц, а также обнаруживать совершаемые ими операции. Информация о предполагаемых преступниках поступает разнородная: об их перемещениях по стране и миру, о наличии имущества в собственности, состоянии счета, всевозможных платежах и отчислениях, а также о социальных связях (для этого устанавливаются взаимодействия с родственниками, одноклассниками, соседями, коллегами, а также фигурантами преступлений). На помощь расследованию приходит система анализа социальных сетей, которая позволяет понять, общается ли предполагаемый преступник с подозрительными личностями, поддерживает ли криминальные контакты, а система интеллектуального анализа текста дает оценку настроения и намерений наблюдаемого гражданина.
Вместо тысячи слов
Одно из требований
к современной аналитической системе – простота и доступность для большего
количества пользователей. Польза от внедрения высокотехнологичных решений в
госсекторе может существенно снижаться, если результаты проведенных
исследований будут доступны слишком ограниченному числу пользователей. Но чтобы
предоставить их всем заинтересованным лицам, потребуется перевести
специфические данные в привычный в стенах данного учреждения формат, а на это
нужно время, ресурсы и организация дополнительных процессов.
Аналитика должна
двигаться в сторону демократизации, считают эксперты SAS. Доступ к результатам исследований нужен не столько ученым или
ИТ-специалистам, сколько чиновникам, не
обладающим глубокими знаниями в математике и программировании. Чтобы сделать результаты
работы с Big Data понятными и наглядными, в последнее время всё чаще
используют специальные средства
визуализации. Образы и графические
картинки позволяют быстрее донести смысл, чем данные, представленные в
текстовом формате, – именно этим объясняется любовь пользователей к
инфографике. Несмотря на то, что при графическом отображении информации
задействуется меньшее количество печатных символов, оно дает большее
представление о корреляции явлений, их влиянии друг на друга, чем перечисление
и словесное описание, каким бы подробным оно ни было.
Российская аналитика: процесс пошел
К инструментам,
нацеленным на выявление закономерностей уже произошедших событий (так
называемая реактивная аналитика), в госсекторе уже успели привыкнуть. Они
позволяют отвечать на вопросы о том, почему произошло то или иное явление,
сколько раз оно случалось, где и в чем был источник проблемы. Однако сегодня ИТ
предлагают решения более глубоких исследовательских задач. Речь о так
называемой проактивной аналитике, которая, собственно, и есть цель внедрения
аналитических решений. Она ориентируется на предсказание
социально-экономических явлений, делает возможным предвосхищение и прогноз событий
и дает доступ к информации, ценность которой значительно выше: «Как будут
развиваться события?», «Что случится при изменении какого-либо параметра?»,
«Как долго сохранится тенденция?» и т. д.
В сторону таких
высокопроизводительных аналитических решений, которые в России уже опробованы
финансовыми организациями и телеком-компаниями, госсектор смотрит все более
внимательно. Пока подобный интерес характерен в большей степени для федеральных
ведомств, накопивших максимальные объемы данных, но и органы местного
самоуправления, как уверены эксперты, скоро начнут внедрения платформ для
углубленной аналитики.
Все предпосылки для этого есть. Оборудованием госучреждения обеспечены,
системы учета и электронного документооборота внедрены, СМЭВ запущена, средства
описательной аналитики имеются – первый этап автоматизации можно считать
завершенным. Если перевести технические показатели в финансовые, эффект от
проектов очевиден, и чиновников это воодушевляет.
Технологии SAS уже давно используется в крупных российских госкорпорациях, которые
всерьез занимаются решением комплексных аналитических задач и извлекают из этого ощутимую финансовую
выгоду. Мы видим в этом подтверждение готовности и зрелости госсектора в
области использования полноценных
аналитических платформ.
Полтора года назад в российском офисе SAS работа
с государственными организациями была выделена в отдельное направление. Создание
решений, нацеленных на прогнозирование, выявление скрытых взаимозависимостей и
связей явлений, – логичный этап развития аналитики в органах власти.
Ситуационные и аналитические центры или подразделения, которые активно
формируются в секторе госуправления, будут решать «тонкие» аналитические
задачи, например, для составления прогноза уровня безработицы с применением
оценки настроений граждан или определения возможного дохода бюджета после
принятия законодательных актов.