Корпоративные системы анализа деятельности на основе хранилищ данных

 

В настоящее время оформился ряд концепций хранения и анализа корпоративных данных:

1) хранилища данных, или склады данных;

2) оперативная аналитическая обработка (On-Line Analytical Processing, OLAP);

3) интеллектуальный анализ данных – ИАД.

Технологии OLAP тесно связаны с технологиями построения хранилищ данных и методами интеллектуальной обработки – ИАД. Поэтому наилучшим вариантом является комплексный подход к их внедрению.

Для того чтобы существующие хранилища данных способствовали принятию управленческих решений, информация должна быть представлена аналитику в нужной форме, то есть он должен иметь развитые инструменты доступа к данным хранилища и их обработки.

Очень часто информационно-аналитические системы, создаваемые в расчете на непосред-ственное использование лицами, принимающими решения, оказываются просты в применении, но жестко ограничены в функциональности. Такие статические системы называются информа-ционными системами руководителя (ИСР). Они содержат в себе предопределенные множества запросов и, будучи достаточными для повседневного обзора, не способны ответить на все вопросы к имеющимся данным, которые могут возникнуть при принятии решений. Результатом работы такой системы, как правило, являются многостраничные отчеты, после тщательного изучения которых у аналитика появляется новая серия вопросов. Однако каждый новый запрос, не предусмотренный при проектировании такой системы, должен быть сначала формально описан, закодирован программистом и только затем выполнен. Время ожидания в таком случае может составлять часы и дни, что не всегда приемлемо. Таким образом, внешняя простота статических СППР, за которую активно борется большинство заказчиков информационно-аналитических систем, оборачивается потерей гибкости.

Динамические СППР ориентированы на обработку нерегламентированных запросов аналитиков к данным. Работа аналитиков с этими системами заключается в интерактивной последовательности формирования запросов и изучения их результатов.

Но динамические СППР могут действовать не только в области оперативной аналитической обработки (OLAP); поддержка принятия управленческих решений на основе накопленных данных может выполняться в трех базовых сферах.

1. Сфера детализированных данных. Это область действия большинства систем, нацеленных на поиск информации. В большинстве случаев реляционные СУБД отлично справляются с возни-кающими здесь задачами. Общепризнанным стандартом языка манипулирования реляционными данными является SQL. Информационно-поисковые системы, обеспечивающие интерфейс конеч-ного пользователя в задачах поиска детализированной информации, могут использоваться в каче-стве надстроек как над отдельными базами данных систем, так и над общим хранилищем данных.

2. Сфера агрегированных показателей. Комплексный взгляд на собранную в хранилище данных информацию, ее обобщение и агрегация, а также многомерный анализ являются задачами систем оперативной аналитической обработки данных (OLAP). Здесь или ориентируются на специальные многомерные СУБД, или остаются в рамках реляционных технологий.

3. Сфера закономерностей. Интеллектуальная обработка производится методами интел-лектуального анализа данных, главными задачами которых являются поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые объясняют найденные аномалии и/или прогнозируют развитие некоторых процессов.

Полная структура информационно-аналитической системы, построенной на основе храни-лища данных, показана на рисунке 7. В конкретных реализациях отдельные компоненты этой схемы часто отсутствуют.

 

 

Рисунок 7. Полная структура корпоративной информационно-аналитической системы, построенной на хранилище данных

 

В основе концепции OLAP лежит принцип многомерного представления данных. В большом числе публикаций аббревиатурой OLAP обозначается не только многомерный взгляд на данные, но и хранение самих данных в многомерной БД. Вообще говоря, это неверно. Необходимость существует не в новой технологии БД, а, скорее, в средствах анализа, дополняющих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP.

Многомерное концептуальное представление являет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению.

Например, измерение “Исполнитель” может определяться направлением консолидации, состоящим из уровней обобщения “предприятие – подразделение – отдел – служащий”. Измерение “Время” может даже включать два направления консолидации – “год – квартал – месяц – день” и “неделя – день”, поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим.