OLAP-системы

Ключевую роль в управлении компанией играет информация. Как правило, даже небольшие компании используют несколько информационных систем для автоматизации различных сфер деятельности. Получение аналитической отчётности в информационных системах, основанных на традиционных базах данных сопряжено с рядом ограничений:

Разработка каждого отчёта требует работы программиста.

Отчёты формируются очень медленно (зачастую несколько часов), замедляя при этом работу всей информационной системы.

Данные, получаемые от различных структурных элементов компании не унифицированы и часто противоречивы.

OLAP-системы, самой идеологией своего построения предназначены для анализа больших объёмов информации, позволяют преодолеть ограничения традиционных информационных систем.

Электронная аналитическая обработка (OLAP) баз данных упрощает обработку запросов бизнес-аналитики. OLAP — это технология организации баз данных, оптимизированная для обработки запросов и получения отчетов, вместо обработки транзакций. Источником данных для OLAP являются базы данных систем оперативной обработка транзакций (OLTP), обычно размещенные в хранилищах данных. Данные OLAP выводятся из этих данных за длительный период времени и объединяются в структуры, дающие возможность сложного анализа. Данные OLAP организуются иерархически и хранятся в кубах вместо таблиц. Это сложная технология, использующая многомерные структуры для обеспечения быстрого доступа к данным для анализа. Такая организация позволяет легко создавать отчеты сводных таблиц и сводных диаграмм для отображения высокоуровневых сводок, таких как совокупность продаж по всей стране, а также отображать подробности для мест, где продажи чрезвычайно велики или малы.

Базы данных OLAP предназначены для ускорения поиска данных. Поскольку сервер OLAP, в отличие от Microsoft Office Excel, вычисляет итоговые значения, требуется меньше данных для пересылки в Excel при создании или изменении отчета. Такой подход дает возможность работать с гораздо большим объемом исходных данных, нежели когда данные организованы как традиционная база данных, в которой Excel отыскивает все отдельные записи и затем вычисляет итоговые значения.

Базы данных OLAP содержат два основных типа данных: показатели, являющиеся числовыми данными, количества и средние значения, используемые для для разработки обоснованных деловых решений, и размерности, являющиеся категориями, используемыми для организации этих показателей. Базы данных OLAP помогают организовать данные по многим уровням детализации, используя знакомые категории для анализа данных.

 

Data Mining - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации).

Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Методы Data Mining имеет смысл применять только для достаточно больших баз данных. Развитие технологий баз банных сначала привело к созданию специализированного языка – языка запросов к базам данных. Для реляционных баз банных – это язык sql, который предоставил широкие возможности для создания, изменения и извлечения хранимых данных. Затем возникла необходимость в получении аналитической информации, и тут оказалось, что традиционные реляционные базы данных плохо приспособлены для проведения анализа. Это привело к созданию «хранилищ данных», сама структура которых наилучшим способом соответствует проведению всестороннего математического анализа.

Отличия Data Mining от других методов анализа данных

Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез и на разведочный анализ, составляющий основу оперативной аналитической обработки данных, в то время как одно из основных положений Data Mining - поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Большинство статистических методов для выявления взаимосвязей в данных используют концепцию усреднения по выборке, приводящую к операциям над несуществующими величинами, тогда как Data Mining оперирует реальными значениями. OLAP больше подходит для понимания ретроспективных данных, Data Mining опирается на ретроспективные данные для получения ответов на вопросы о будущем.

 

Корпоративная информационная система (КИС) – это вся инфраструктура предприятия, задействованная в процессе управления всеми информационно-документальными потоками, включающая в себя следующие обязательные элементы:

-Информационная модель, представляющая собой совокупность правил и алгоритмов функционирования ИС. Информационная модель включает в себя все формы документов, структуру справочников и данных, и т.д.

-Регламент развития информационной модели и правила внесения в неё изменений.

-Кадровые ресурсы (департамент развития, привлекаемые консультанты), отвечающие за формирование и развитие информационной модели.

-Кадровые ресурсы, отвечающие за конфигурирование ПК, и его соответствие утвержденной информационной модели.

-Аппаратно-техническая база, соответствующая требованиям по эксплуатации ПК (компьютеры на рабочих местах, периферия, каналы телекоммуникаций, системное ПО и СУБД)

-Эксплуатационно-технические кадровые ресурсы, включая персонал по обслуживанию аппаратно-технической базы.

-Правила использования ПК и пользовательские инструкции, регламент обучения и сертификации пользователей.