Извлечение знаний на основе информационных хранилищ

В отличие от интеллектуальной базы данных информационное хранилище представляет собой хранилище извлеченной значимой информации из оперативных баз данных, которое предназначено, в первую очередь, для оперативного анализа данных (реализации OLAP - технологии). Формулирование запроса осуществляется в результате применения интеллектуального интерфейса, позволяющего в диалоге гибко определять значимые признаки анализа для произвольной группировки данных. Наиболее известными инструментальными средствами поддержки информационных хранилищ и OLAP - технологий являются такие инструментальные средства, как статистический пакет прикладных программ SAS, специализированные программы Business Objects, Oracle Express, отечественные программные продукты Poly Analyst, Контур Стандарт и др.

Типичными задачами оперативного ситуационного анализа, решаемых на основе информационных хранилищ, являются:

· Определение профиля потребителей конкретного товара;

· Предсказание изменений ситуации на рынке;

· Анализ зависимостей признаков ситуаций (корреляционный анализ) и др.

 

Для решения перечисленных задач требуется применение методов извлечения знаний из баз данных (Оа(:а Мшш§ или Кпоу(О1зсоуегу), основанные на применении методов многомерного статистического анализа, индуктивных методов построения дерев] решений, нейронных сетей, генетических алгоритмов.

Рассмотрим сущность применения ранее не рассмотренного метода, основанного на применении генетических алгоритмов. Пусть требуется определить набор экономических показателей, которые в наибольшей степени влияют на положительную динамику поведения рынка. Тогда набор показателей можно рассматривать как набор хромосом, определяющих качества индивида, то есть решения поставленной задачи. Значения показателей, определяющих решение при этом соответствуют генам.

Генетические алгоритмы имеют ряд недостатков. Критерий отбора хромосом и сама процедура являются эвристическими и далеко не всегда гарантируют нахождения лучшего решения. Как и в реальной жизни, эволюция может остановиться на какой-либо непродуктивной ветви. С другой стороны можно подобрать примеры, когда из эволюции генетическим алгоритмом исключаются перспективные продолжения. Это особенно становится заметно при решении задач большой размерности со сложными внутренними связями.

В качестве примера разработки систем на основе генетических алгоритмов можно привести систему GeneHunter фирмы WardSystems Group.