Требования к архитектуре ИХ.

1) единообраз.опред.структ.многомерных данных с равноправным измер.информ.пространства

2) поддержка многопольз.реш.в среде клиент-сервер

3) легкая адаптация к новым информ.потребностям

4) выполнение запросов без количественных ограничений

5) удобный интерфейс

Многомерное хранилище может быть в виде одной из след.структур:

1) MOLAP – физ.структура, в кот. с опред.периодичностью загруж.данные с файлов-источников

2) вирт.структура ROLAP, кот.динамич.использ.при запросах, вызывающ.физич. манипулирование с файлами-источниками из реляц.БД (инструмент-м средством явл. Informix

3) гибридная структура – HOLAP, исп.при построении многоуровнего ИХ, применяем.на разных уровнях управления в больших корпорациях. Инструмент.ср-во – SAS SYSTEM

Подсистема Мета-информация(репозиторий)

Репозиторий предст. описание структуры инф.хранилища.

-состав показателей

-иерархия, агрегация измерений

- форматы данных

- используемые функции

-физическое размещение на сервере

-права доступа пользователей

-частота обновлений

Важной функцией репозитория явл. представление схемы отображения данных файлов-источников на стр-ре данных информационного хранилища

В репозитории задается также схема отображения структуры инф.хранилища на схемах представления данных пользователя или витринах данных. Отображ.осуществляется либо через механизм межуровневого взаимодействия, либо через процедуру преобразования данных.

Подсистема преобразования данных создается только для MOLAP (для ROLAP преобраз-е осуществляется прямо из файлов-источников). Требуется осуществление след.функций (в обоих случаях):

1) сбор данных

2) очистка (происходит проверка данных)

3) агрегирование (осущест.суммирование по заданным в репозитарии признакам)

4) подсистемы предст.данных (организация витрин данных - ВД)

витрина данных – предметно-ориентированное хранилище, агрегир.информация для конкретной группы пользователей

5) информ.система для руководителя

Подсистема оперативного анализа данных (OLAP-технологии)

-в осно.исп.лицами, которые занимаются принятием решений путем использ.стат.группировок. В рамках польз.интерфейса исп.след.базовые операции:

1) поворот (добавление нового признака)

2) проекция (выборка подмножества)

3) раскрытие (декомпозиция признака агрегации на компоненты)

4) свертка

5) сечение – выделение подмножества данных по конкретным значениям одного или неск.измерений

Подсистема инт. данных (извлечения данных)

DATA-MINING

 

-используется в основном аналитиками, кот.исп. ИХ обнаруж. некоторые закономерности

Типичные задачи:

-прогнозирование

-установка временных, причинно-следственных и др.связей

-классиф.ситуаций

 

Основные методы ИА

-многомерного стат-анализа

-индукции

-нейронные сети

подсистема WEB-публикации