Разделы

Бизнес Цифровизация Бизнес-приложения

OLAP: как разобрать информационную свалку

Оперативный доступ к информации и ее эффективный анализ – то, чего до сих пор не хватает многим предприятиям для успешного развития бизнеса. В одном случае накопленные массивы данных представляют собой просто набор отчетов, лишенных единой структуры, в другом – пользователи просто не имеют постоянного и быстрого доступа к необходимым базам, в третьем – даже имея на руках все требующиеся данные, сотрудники предприятия не в состоянии сделать из них соответствующие выводы. Во всех перечисленных ситуациях эффективность бизнеса заметно снижается. Многие эксперты придерживаются мнения, что в такой ситуации следует любым способом налаживать процесс работы с информацией. Как вариант - внедряя OLAP-продукты.

Бизнес накопил огромные объемы информации, но без умения эффективно использовать ее при принятии решений она становится бесполезной. Исторически анализ начинался с построения отчетности в учетных системах, однако попытки развития отчетности транзакционной системы в полноценный инструмент аналитика показала ограниченность данного подхода. Выявились следующие проблемы: в учетной системе могут храниться данные только последнего периода; структура информации нацелена на оперативное внесение данных и не эффективна при группировке по аналитическим признакам; нужная информация может быть "рассеяна" по базам разных учетных систем и т.п.

Составляющие принципа FASMI

Fast - быстрый отклик системы, не более 5 сек.;

Analysis - полнофункциональный анализ максимально удобным способом;

Shared – многопользовательский доступ, защита информации;

Multidimensional – многомерное концептуальное представление данных в виде кубов с иерархическими измерениями;

Information – получение информации в нужном объеме, там, где она необходима.

Требовался совершенно новый подход, который и был предложен в 1993 году основоположником реляционных баз данных Эдгаром Коддом. Сформулированные им 12 правил определили сущность технологии OLAP (On-Line Analytical Processing). Впоследствии правила были переработаны в принцип FASMI (Fast Analysis of Shared Multidimensional Information).

Центральным пунктом в этом списке является многомерное представление данных. При таком подходе информация классифицируется по заданному набору признаков, образующему измерения многомерного пространства данных. Это позволяет пользователю видеть интересующую его информацию в наиболее интуитивно понятном виде – в виде таблицы, по осям которой развернуты нужные сочетания аналитик, а внутри находятся сгруппированные нужным образом данные.

В настоящее время технология OLAP получила широкое признание. Линейки OLAP-продуктов представляют практически все основные производители программного обеспечения для баз данных. Несмотря на впечатляющие возможности технологии многомерных БД, ряд распространенных заблуждений часто мешает успешному внедрению OLAP-продуктов.

Мифы об OLAP

Многие пользователи под online-анализом ошибочно понимают наличие и применение наиболее актуальных данных. В действительности под термином "online"-анализ подразумевается быстрая реакция системы на формируемую пользователем последовательность уточняющих запросов. Анализ как бы следует за мыслью аналитика. Например, региональный менеджер может рассуждать следующим образом: "Чем вызван спад продаж по региону в прошлом месяце ? - Это связано с определенным магазином ? - Как в этом магазине распределялись продажи по дням? - Почему такой низкий уровень продаж в первой половине месяца? - Хорошо ли продавались товары группы "A"? - Были ли эти товары на складе?" И после этого он принимает решение, например, о повышении страхового запаса товаров группы "А" на складе.

4 мифа об OLAP

Миф 1. OLAP – online-анализ, значит, в нем наиболее актуальные данные;
Миф 2. OLAP – это просто средство визуализации данных;
Миф 3. OLAP заменяет систему отчетности;
Миф 4. Для получения желаемого результата достаточно просто подключить OLAP к учетной системе.

При этом далеко не обязательно, что в аналитической базе присутствуют данные до последней транзакции. Достаточно распространенной является практика, когда данные в аналитической базе обновляются раз в сутки и содержат информацию "на начало дня". Во многих случаях, как, например, в приведенном выше, это не влияет на достоверность анализа.

Дмитрий Бондарь, «РТК-Солар»: Зрелость отечественных решений IdM сопоставима с иностранными
Импортозамещение

Еще одно заблуждение, распространенное среди начинающих пользователей OLAP, заключается в восприятии этих систем просто как средства отображения тех же данных, что есть в учетной системе, в многомерном виде. Этим заблуждением часто пользуются некоторые производители программных продуктов, предлагающие пользователям псевдо-OLAP функциональность, например, имитацию куба с помощью запросов к традиционной базе. В действительности же эти решения крайне зависимы от объема хранимых данных, что вступает в противоречие с одним из основных правил Э. Кодда, требующего, чтобы производительность формирования отчетов существенно не падала с увеличением размеров базы данных. В OLAP-продуктах это достигается хранением предварительно вычисленных агрегированных значений. Например, в отличие от традиционных баз учетных систем, где хранится список продаж товаров, в OLAP-базе дополнительно могут храниться итоги продаж в разрезе товаров, категорий товаров, клиентов и т.п.

Вадим Ляхин: тенденции связаны со стремлением предоставить всё большую функциональность конечному пользователю аналитической системы

Вадим ЛяхинНа вопросы CNews ответил специалист отдела разработки ПО компании "Инталев" Вадим Ляхин

CNews: Какие тенденции в развитии СУБД в области анализа данных вы отмечаете сегодня?

Вадим Ляхин: Думаю, можно выделить два рода тенденций – количественные и качественные. К количественным я бы отнес стремление разработчиков уменьшить до минимума время отклика системы и вместе с тем повысить оперативность с которой в аналитическую систему попадают данные.

Качественные тенденции связаны с стремлением предоставить всё большую функциональность и гибкость конечному пользователю аналитической системы. К проявлениям этой тенденции можно, например, отнести намерение Microsoft включить в новые версии Excel такую OLAP функциональность, как внесение данных в кубы (обратная запись) и средства Data Mining. Естественно, что появление подобных возможностей сделает востребованной их поддержку со стороны разработчиков работающих в области разработки средств анализа данных.

Читать далее

Третий миф, связанный с OLAP, состоит в том, что пользователи воспринимают ее как равнозначную замену системе отчетности. На самом деле многое зависит от особенностей отчетности предприятия. Часто она характеризуется жесткой регламентацией форм, требованиями к периодичности формирования, спискам рассылки. Эти требования могут быть обеспечены только использованием системы построения отчетов вместе с OLAP.

Другим важным моментом является то, что часто предприятия составляют объемные отчеты с высокой степенью детализации. Такие отчеты пользователи зачастую могут более эффективно строить без применения многомерных структур, т.к. время отклика многомерных систем обычно линейно зависит от количества возвращаемых ячеек. OLAP эффективна на запросах, возвращающих итоговые данные, получение которых традиционными методами требует большого объема вычислений.

Многие пользователи также ошибочно полагают, что для получения желаемого результата достаточно просто подключить OLAP к учетной системе. Другая формулировка того же заблуждения: "OLAP консолидирует данные разных учетных систем". Многомерная база действительно обычно содержит консолидированные из разных учетных систем данные. Однако, несмотря на то, что OLAP-продукты обычно имеют возможности подключения к различным учетным системам, в большинстве случаев задача консолидации решается на уровне хранилища данных. В процессе пополнения хранилища данными из учетных систем решаются и такие задачи, как очистка данных, отображение данных учетных систем в единое справочное пространство предприятия и т.п.