Базы и хранилища данных предприятий и организаций

 

Базы данных являются ядром информационного обеспечения АИС. В них должна быть представлена информация, отражающая различные направления деятельности организации и пригодная для проведения всестороннего анализа. Хранилище данных, которое является следующим этапом развития БД, выполняет следующие функции:

– собирает информацию из различных источников, прежде всего из оперативных приложений АИС, а также от внешних источников, например, организаций по исследованию рынка, лабо-раторий по оценке качества, консалтинговых компаний и независимых аналитиков;

– интегрирует данные в логические модели по определенным предметным областям;

– хранит информацию таким образом, чтобы она была легко доступна и понятна различным категориям пользователей;

– предоставляет данные разнообразным приложениям.

АИС работает с двумя разными типами информации:

– постоянно изменяемые базы данных систем оперативной обработки содержат детальную информацию по определенному процессу;

– аналитические данные содержат обобщенные сведения по достаточно широкой предметной области, которая может охватывать различные направления деятельности.

Общая структура взаимодействия оперативной и аналитической информации представлена на рисунке 5.

Основным источником информации, поступающей в оперативную БД, является деятельность корпорации. Для проведения анализа данных требуется привлечение внешних источников информации (например, статистических отчетов). Хранилище данных должно включать как внутренние корпоративные данные, так и внешние данные. Хранилища данных – это информационные структуры, которые проектируются для поддержки процессов принятия решений, а не просто для эффективного сбора и обработки данных.

 

 

Рисунок 5. Общая схема взаимодействия оперативных и аналитических БД

 

Для оперативной обработки требуются данные за несколько последних месяцев, для проведения достоверного анализа и прогнозирования в хранилище данных нужно иметь информацию о деятельности корпорации и состоянии рынка на протяжении нескольких лет. Объем аналитических БД, как минимум, на порядок больше объема оперативных.

Во многих крупных корпорациях одновременно существуют несколько оперативных АИС с собственными БД (по историческим причинам). Оперативные БД могут содержать семантически эквивалентную информацию, представленную в разных форматах, с разным указанием времени ее поступления, иногда даже противоречивую. Хранилище данных должно содержать единообразно представленную и согласованную информацию, максимально соответствующую содержанию оперативных БД. Для этого необходима компонента для извлечения и “очистки” информации из разных источников.

Оперативные АИС создаются в расчете на решение конкретных задач. Информация из БД выбирается часто и небольшими порциями. Обычно набор запросов к оперативной БД известен уже при проектировании. Набор запросов к аналитической базе данных предсказать невозможно. Хранилища данных существуют, чтобы отвечать на нерегламентированные (ad hoc) запросы аналитиков. Можно рассчитывать только на то, что запросы будут поступать не слишком часто и затрагивать большие объемы информации. Размеры аналитической БД стимулируют исполь-зование запросов с агрегатами (сумма, минимальное, максимальное, среднее значение и т.д.).

Оперативные БД по своей природе являются сильно изменчивыми, что учитывается в используемых СУБД (нормализованная структура БД, строки хранятся неупорядоченно и т.д.). При малой изменчивости аналитических БД (только при загрузке данных) оказываются разумными упорядоченность массивов, более быстрые методы индексации при массовой выборке, хранение заранее агрегированных данных.

Для оперативных ИС обычно хватает защиты информации на уровне таблиц. Информация аналитических БД настолько критична для корпорации, что требуется большая грануляция защиты (индивидуальные права доступа к определенным строкам и/или столбцам таблицы).

В целом схема потоков данных в информационном хранилищепоказана на рисунке 6.

 

 

Рисунок 6. Схема потоков данных в информационном хранилище