Расхождения в требованиях к хранению данных в БД и ХД.

В базе данных хранятся только последние значения какой-либо информации (например, текущее значение счета клиента, текущее значение имени и параметров клиента). В хранилище данных будет содержаться не только текущая информация, но и вся историческая, ретроспективная информация с предысторией и уточнениями и обязательно с указанием периода или момента времени, когда те или иные данные были актуальны.

Несмотря на обилие данных, возможностей их сбора и хранения, организации до сих пор испытывают серьезный недостаток в информации, необходимой для принятия решений.

Существующие системы сбора и обработки корпоративных данных в принципе не пригодны для использования в ППР. Данные разнотипны и распределены как внутри организации, так и за ее пределами. Лицам, принимающим решения (ЛПР) и аналитикам приходится принимать решения не только в условиях неполной, но и зачастую недостоверной и противоречивой информации. К тому же не всегда удается получить требуемую информацию во время и в наглядном виде. В результате - неудачные решения.

Почему нельзя использовать традиционные БД в процессе принятия решений?

• невозможность преобразования в базах данных разнородных данных, так как они часто не имеют меток времени.

• данные в базах данных подвержены частым изменениям.

• данные годятся для оперативной обработки, но не для аналитической обработки.

• трудно понять, где находятся данные, необходимые для анализа и принятия решения;

• большинство БД ориентировано только на стандартные запросы, для выполнения нестандартных запросов нужно привлекать программистов.

• низкая производительность при нестандартных запросах.

 

В Хранилище данных могут производиться следующие операции с данными:

  1. Загрузка данных – это помещение данных в хранилище, производится путем добавления новых фактов или корректировкой существующих.
  2. Извлечение данных – это перемещение информации от источников данных в отдельную Базу данных, приведение источников данных к единому формату.
  3. Преобразование данных – это подготовка информации к хранению в оптимальной форме для реализации запроса, необходимого для принятия решений.
  4. Анализ данных – OLAP, Data Mining, сводные отчёты.