рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Технологии интеллектуального анализа данных

Технологии интеллектуального анализа данных - раздел Образование, Часто вид платформы зависит от использования сервера баз данных. Тогда выде­ляют следующие виды платформ Технологии Интеллектуального Анализа Данных Обеспечивают Формирование Анали­т...

Технологии интеллектуального анализа данных обеспечивают формирование анали­тических данных посредством выполнения операции очищения данных локальных баз ор­ганизации, применения статистических методов и других сложных алгоритмов. Появлению аналитических систем способствовало осознание руководящим звеном предприятий факта, что в базах данных содержится не только информация, но и знания (скрытые закономерно­сти). Последние позволяют охарактеризовать процесс управления предприятием и дать ин­теллектуальную информацию для более обоснованного принятия решений.

Можно выделить следующие технологии интеллектуального анализа данных:

• Оперативный анализ данных посредством OLAP-систем;

• Поиск и интеллектуальный выбор данных Data Mining;

• Деловые интеллектуальные технологии BIS;

• Интеллектуальный анализ текстовой информации.

Аналитические системы OLAP (On-Line Analytical Processing) предназначены для анализа больших объемов информации в интерактивном создании интеллек­туального капитала (аналитических данных), позволяющего руководителю принять обос­нованное решение. Они обеспечивают:

• Агрегирование и детализацию данных по запросу;

• Выдачу данных в терминах предметной области;

• Анализ деловой информации по множеству параметров (например, поставщик, его местоположение, поставляемый товар, цены, сроки поставки и т.д.);

• Многопроходный анализ информации, который позволяет выявить не всегда очевидные тенденции в исследуемой предметной области;

• Произвольные срезы данных по наименованию, выбираемых из разных внутрен­них и внешних источников (например, по наименованию товара);

• Выполнение аналитических операций с использованием статистических и других методов;

• Согласование данных во времени для использования в прогнозах, трендах, срав­нениях (например, согласование курса рубля).

Основные требования, предъявляемые к приложениям для многомерного анализа:

• Предоставление пользователю результатов анализа за приемлемое время (не бо­лее 5 сек.);

• Осуществление логического и статистического анализа, его сохранение и ото­бражение в доступном для пользователя виде;

• Многопользовательский доступ к данным;

• Многомерное представление данных;

• Возможность обращаться к любой информации независимо от места ее хранения и объема.

Многомерный анализ может быть реализован средствами анализа данных офисных приложений и распределенными OLAP-системами.

Исходные и аналитические данные могут храниться по разному. Наибольший эф­фект достигается при использовании многомерных кубов. Рассмотрим на примерах поня­тие многомерного куба.

Если учесть, что в каждой стране может существовать несколько клиентов, то до­бавляется четвертое измерение.

Вообще под измерением понимается один из ключей данных, в разрезе которого можно получать, фильтровать, группировать и отражать информацию о фактах. Примеры измерений: страна, клиент, товар, поставщик. Факт - это число, значение. Факты можно суммировать вдоль определенного измерения. Их можно группировать, выполнять над ни­ми другие статистические операции. Агрегатноеданное - суммарное, среднее, минималь­ное, максимальное и другое значение, полученное посредством статистических операций.

В настоящее время применяются три способа хра­нения многомерных баз данных:

• Системы оперативной аналитической обработки многомерных баз данных MOLAP (Multidimensional OLAP) - исходные и агрегатные данные хранятся в многомер­ной базе данных. Многомерные базы данных представляют собой гиперкубы или полику­бы. В гиперкубах все измерения имеют одинаковую размерность, В поликубе каждое из­мерение имеет свою размерность. Многомерная база данных оказывается избыточной, так как она полностью содержит исходные данные реляционных баз.

• Системы оперативной аналитической обработки реляционных баз данных
ROLAP (Relational OLAP) - исходные данные остаются в реляционной базе, агрегатные
данные размещаются в кэш той же базы.

• Гибридные системы оперативной аналитической обработки данных HOLAP
(Hybrid OLAP) - исходные данные остаются в реляционной базе, а агрегатные данные
хранятся в многомерной базе данных (MDD).

Многомерный. анализ данных может быть произведен посредством клиентских
приложений и серверных OLAP-систем. .

Клиентские приложения, содержащие OLAP-средства, позволяют вычислять агре­гатные данные. Агрегатные данные размещаются в кэш внутри адресного пространства та­кого OLAP-средства, Кэш - быстродействующий буфер большой емкости, работающий по специальному алгоритму. При этом если исходные данные находятся в реляционной базе, вычисления производятся OLAP-средствами клиентского приложения. Если исходные дан­ные размещаются >на сервере баз данных, то OLAP-средства приложений посылают SQL-запросы на сервер баз данных и получают агрегатные данные, вычисленные сервером.

Примерами клиентских приложений, содержащими OLAP-средства, являются при­ложения статистической обработки данных SEWSS (Statistic Enterprise - Wide SPS System) фирмы StatSoft и MS Excel 20.00. Excel позволяет создать и сохранить двух или трехмер­ный небольшой OLAP-куб.

Многие средства проектирования позволяют создавать простейшие OLAP-средства. Например, Borland Delphi и Borland C++ Builder.

Отметим, что клиентские приложения применяются при малом числе измерений (не более шести) и небольшом разнообразии значений этих измерений.

Серверные OLAP-системы развили идею сохранения кэш с агрегатными данными.

В них сохранение и изменение агрегатных данных, поддержка содержащего их хранилища осуществляется отдельным приложением (процессом), называемым OLAP-сервером. Клиентские приложения делают запросы к OLAP-серверу и получают требуе­мые агрегатные данные.

Применение OLAP-серверов сокращает трафик сети, время обслуживания запро­сов, сокращает требования к ресурсам клиентских приложений.

В масштабе предприятия обычно используются OLAP-серверы типа Oracle Express Server, MS SQL Server 2000 Analysis Services и др.

Заметим, что MS Excel 2000 позволяет делать запросы к OLAP-серверам.

Серверных OLAP-системы на базе информационных хранилищ поддерживают все способы хранения данных.

Аналитическая система обеспечивает выдачу агрегатных данных по запросам клиентов. Сложность аналитических систем вызвана реализацией сложных интеллектуальных запросов.

Интеллектуальные запросы осуществляют поиск по условию или алгоритму вычисления от­вета. Например, выбрать для выпуска изделия, приносящие максимальную прибыль. Само ус­ловие может доопределяться в ходе формирования ответа, что усложняет алгоритм формиро­вания ответа. Данные для формирования ответа могут находиться в разных внутренних и внешних базах. Существующий язык запросов SQL расширяется возможностью построения интеллектуальных запросов. Пример такого запроса - сравнить данные о продажах в конкрет­ные месяцы, но разные годы. Для таких запросов используются непроцедурные языки обраще­ния к многомерным базам данных. Примером такого языка запросов является язык MDX (Mul­tidimensional Expressions). Он позволяет формировать запрос и описывать алгоритм вычислений. Язык SQL используется для извлечения данных из локальных баз. Язык MDX служит для извлечения данных из многомерных баз и информационных хранилищ.

 

Аналитические данные используются в системах поддержки принятия решений.

Самые современные аналитические системы основываются на информационных хранилищах и обеспечивают весь спектр аналитической обработки. Доступ к информаци­онным хранилищам реализован посредством транзакций. По интеллектуальным запросам OLAP-системы информационное хранилище выдает аналитические данные. По запросам, объединенным в транзакции, других систем информационное хранилище обеспечивает их обработку, выдачу ответов и отчетов, но не обеспечивает функцию анализа данных. Именно поэтому эти системы называются OLTP-системами (On-Line Transaction Process­ing) в отличие от OLAP-систем.

Примером OLAP-систем является Brio Query Enterprise корпорации Brio Technol­ogy. OLAP-средства включают в свои системы фирмы 1C, Парус и др. Технологии Data Mining (добыча данных) разработаны для поиска и выявления в данных скрытых связей и взаимозависимостей с целью предоставления их руководителю в процессе принятия решений. Для этого используются статистические методы корреля­ции, оптимизации и другие, позволяющие находить эти зависимости и синтезировать де­дуктивную (обобщающую) информацию. Технологии обеспечивают:

Поиск зависимых данных (реализацию интеллектуальных запросов);

Выявление устойчивых бизнес - групп (выявление групп объектов, близких по
заданным критериям);

• Ранжирование важности измерений при классификации объектов для проведения
•анализа;

• Прогнозирование бизнес - показателей (например, ожидаемые продажи, спрос);

• Оценка влияния принимаемых решений на достижение успеха предприятия;

• Поиск аномалий и т.д.

Технологии Data Mining позволяют наблюдать за текущей информацией с целью поиска отклонений и тенденций без внимания в смысл самих данных. Их применяют, на­пример, для оценки поведения покупателей, чтобы внести изменения в рекламную такти­ку, для корректировки выпуска продукции, изменения ценовой политики и т.д.

Интеллектуальные деловые технологии BIS (Business Intelligence Services) пре­образуют информацию из внутренних и внешних баз в интеллектуальный капитал (анали­тические данные). Главными задачами систем интеллектуального выбора данных является поиск функциональных и логических закономерностей в накопленных данных для под­сказки обоснованных управленческих решений. Они основаны на применении технологий информационного хранилища и алгоритмов автоматизации деловых процессов (Workflow). Аналитические данные предоставляются руководству всех уровней и работ­никам аналитических служб организации по запросам в удобном виде.

Технология BIS описана в пункте 3.4.

Для интеллектуального анализа текстовой информации разработаны структурные аналитические технологии (CAT). Они ориентированы на углубленную обработку неструктурированной информации. Реализуют уникальную способность человека интерпретировать (толковать) содержание текстовой информации и устанавливать связи между фрагментами текста. CAT реализованы на базе гипертекстовой технологии, лин­гвистических процессоров, семантических сетей. .

Структурные аналитические технологии предназначены для решения разнообраз­ных задач аналитического характера на основе структуризации предварительно отобран­ной текстовой информации. Являются инструментом создания аналитических докладов, отчетов, статей, заметок для использования в информационно-аналитических службах ор­ганизаций, отраслей, государственного управления, СМИ и т.д.

– Конец работы –

Эта тема принадлежит разделу:

Часто вид платформы зависит от использования сервера баз данных. Тогда выде­ляют следующие виды платформ

Совокупность методов и производственных процессов экономических информа ционных систем определяет принципы приемы методы и мероприятия... Цель применения информационных технологий снижение трудоемкости... Процесс обработки данных в ЭИС невозможен без использования техниче ских средств которые включают компьютер...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Технологии интеллектуального анализа данных

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Эволюция информационных технологий
Появление первого печатного станка и книгопечатания (1445 г.) произвело первую информационную революцию, которая длилась примерно 500 лет. Знания стали тиражи­роватьс

Свойства информационных технологий
Информационные технологии играют важную стратегическую роль, так как их при­менение позволило представить в формализованном виде, пригодном для практического ис­пользова

Следует запомнить
1. Под информационной технологией понимается совокупность методов, производственных процессов и программно-технических средств, объединенная технологическим процессом и обеспечивающая сбор, хранени

Информационные технологии электронного офиса
Word - текстовый процессор - наиболее широко используемое приложение, так как писать и оформлять тексты требуется многим пользователям. Раньше подобные про­граммы называ

Технологии обработки графических образов
Потребность использования графиков, диаграмм, схем, рисунков, этикеток в произвольный текст или документ вызвала необходимость создания графических процессо­ров. Графические процессоры представляют

Гипертекстовая технология
Способ хранения информации в виде отчетов, докладов, файлов и т.д. не удобен, так как приводит к значительным потерям времени при поиске связанных единой1 темати­кой или смыслом данных. Поэтому был

Сетевые технологии
Одной из первых сетей, оказавших влияние на дальнейшее развитие сетевых тех­нологий, явилась ArpaNet (сеть АРПА), созданная пятьюдесятью у

Технология мультимедиа
Гипертекстовая технология показала, что можно сослаться на статью,-со держащую текст, графический, звуковой, видео материал, мультипликацию. Это позволило создать новую

Технологии видеоконференции
Видеоконференция - это технология, обеспечивающая двум или более удалён­ным друг от друга пользователям возможность общаться между собой, видеть и слышать других

Интеллектуальные информационные технологии
Информационные технологии имеют дело с информацией в виде фактов, данных, документов. Интеллектуальные информационные технологии преобразу

Технологии обеспечения безопасности обработки информации
При использовании любой информационной технологии следует обращать внима­ние на наличие средств защиты данных, программ, компьютерных систем. Безопасность данных

Технологии интегрированных информационных систем общего назначения
3.1. Технологии геоинформационных систем В настоящее время все большее распространение получают технологии геоинформационных систем (ГИС), предназначенных дл

Технологии распределенной обработки данных
Одной из важнейших сетевых технологий в экономических информационных сис­темах является распределенная обработка данных. То, что персональные компьютеры стоят на рабо

Технологии информационных хранилищ
Использование баз данных не дает желаемого результата автоматизации деятель­ности предприятия. Причина проста: реализованные функции хранения, обработки дан­ных по запросу значительно отличаются от

Технологии электронного документооборота
Первые системы электронного документооборота (СЭД) состояли из трех час­тей: системы управления документами, системы массового ввода бумажных документов, системы автомат

Следует запомнить
Технологии геоинформационных систем обеспечивают работу с многослойной ба­зой данных. К технологиям распределенной обработки данных относятся: технология файл-сервер, клиент-сервер, распре

Технологии построения корпоративных информационных систем
Корпоративная информационная система (КИС) — автоматизированная система управления крупными, территориально рассредоточенными предприятиями, имеющими несколько ур

Технологии экспертных систем
ЭИС состоит из нескольких функциональных подсистем, обрабатывающих множе­ство локальных баз данных. При этом разные функции управления реализуются разными подсистемами. Например, для контроля испол

Технологии систем поддержки принятия решений
До появления аналитических систем предпринимались попытки создания автома­тизированных систем управления на основе анализа данных локальных баз предприятия. Однако реализованные функции значительно

Следует запомнить
Задачи управления требуют нетривиальных подходов к их решению, так как для принятия решений требуются не просто данные, но их новый вид - знания. Управленче­ское решение необходимо принимать, учиты

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги