рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Технология хранилищ данных Data Warehousing

Технология хранилищ данных Data Warehousing - раздел Информатика, Информационные технологии в экономике: Учеб. пособие З.В.Архипова,В.А.Пархомов Иркутск: Изд-во БГУЭП, 2003   Во Всем Мире Организации Накапливают Или Уже Накопили В Проце...

 

Во всем мире организации накапливают или уже накопили в процессе своей деятельности большие объемы данных. Эти коллекции данных хранят в себе большие потенциальные возможности по извлечению новой, аналитической информации, на основе которой можно и необходимо стро­ить стратегию фирмы, выявлять тенденции развития рынка, находить новые решения, обусловливающие успешное развитие в условиях конкурентной борьбы. Для некоторых фирм такой анализ является неотъемлемой частью их повседневной деятельности, но большинство, очевидно, только начинает приступать к нему всерьез.

Попытки строить системы принятия решений, которые обращались бы непосредственно к базам данных систем оперативной обработки транзакций (OLTP-систем), оказываются в большинстве случаев неудачными.

Для того чтобы обеспечить возможность анализа накопленных данных, организации стали создавать хранилища данных (Data Warehouse — DW), которые представляют собой интегрированные коллекции данных, кото­рые собраны из различных систем оперативного доступа к данным.

Концепция DW была предложена и в 1992 г. Биллом Инмоном в его книге "Building the Data Warehouse" и стала одной из доминирующих в разработке информационных технологий обработки данных 90-х годов. Англоязычный термин Data Warehousing, который сложно перевести лако­нично на русский язык, означает создание, поддержку, управление и ис­пользование хранилища данных, что говорит о том, что речь идет о про­цессе. Цель этого процесса - непрерывная поставка необходимой инфор­мации нужным сотрудникам организации. Этот процесс подразумевает по­стоянное развитие, совершенствование, решение все новых задач и практически никогда не кончается, поэтому его нельзя уместить в более или менее четкие временные рамки, как это можно сделать для разработки традиционных систем оперативного доступа к данным.

Хранилища данных становятся основой для построения систем приня­тия решений.

Основная цель создания DW в том, чтобы сделать все значимые для управления бизнесом данные доступными в стандартизованной форме, пригодными для анализа и получения необходимых отчетов. Чтобы дос­тигнуть этого, необходимо извлечь данные из существующих внутренних и внешних машиночитаемых источников.

Несмотря на различия в подходах и реализациях, всем хранилищам данных свойственны следующие общие черты: предметная ориентиро­ванность; интегрированностъ; привязка ко времени; неизменяемость.

Предметная ориентированность. Информация в хранилище данных организована в соответствии с основными аспектами деятельности пред­приятия (заказчики, продажи, склад и т.п.); это отличает хранилище данных от оперативной БД, где данные организованы в соответствии с про­цессами (выписка счетов, отгрузка товара и т.п.). Предметная организация данных в хранилище способствует как значительному упрощению анализа, так и повышению скорости выполнения аналитических запросов. Выражается она, в частности, в использовании иных, чем в оперативных системах, схемах организации данных. В случае хранения данных в реляционной СУБД применяется схема "звезды" (star) или "снежинки" (snowflake). Кро­ме того, данные могут храниться в специальной многомерной СУБД в n-мерных кубах.

Интегрированностъ.Исходные данные извлекаются из оперативных БД, проверяются, очищаются, приводятся к единому виду, в нужной сте­пени агрегируются (то есть вычисляются суммарные показатели) и загружаются в хранилище. Такие интегрированные данные намного проще анализировать.

Привязка ко времени. Данные в хранилище всегда напрямую связаны с определенным периодом времени. Данные, выбранные из оперативных БД, накапливаются в хранилище в виде "исторических слоев", каждый из кото­рых относится к конкретному периоду времени. Это позволяет анализиро­вать тенденции в развитии бизнеса.

Неизменяемость. Попав в определенный "исторический слой" хранилища, данные уже никогда не будут изменены. Это также отличает храни­лище от оперативной БД, в которой данные все время меняются, "дышат", и один и тот же запрос, выполненный дважды с интервалом в 10 минут, может дать разные результаты. Стабильность данных также облегчает их анализ.

Хранилища и киоски данных. Хранилища данных могут быть разбиты на два типа: корпоративные хранилища данных (enterprise data warehouses) и киоски данных (data marts).

Корпоративные хранилища данных содержат информацию, относя­щуюся ко всей корпорации и собранную из множества оперативных ис­точников для консолидированного анализа. Обычно такие хранилища охватывают целый ряд аспектов деятельности корпорации и используются для принятия как тактических, так и стратегических решений. Корпоративное хранилище содержит детальную и обобщающую информацию; его объем может достигать от 50 Гбайт до одного или нескольких терабайт. Стоимость создания и поддержки корпоративных хранилищ может быть очень высокой. Обычно их созданием занимаются централизованные отделы информационных технологий, причем создаются они сверху вниз, то есть сначала проектируется общая схема, и только затем начинается заполнение данными. Такой процесс может занимать несколько лет.

Киоски данных содержат подмножество корпоративных данных и строятся для отделов или подразделений внутри организации. Киоски данных часто строятся силами самого отдела и охватывают конкретный ас­пект, интересующий сотрудников данного отдела. Киоск данных может получать данные из корпоративного хранилища (зависимый киоск) или, что более распространено, данные могут поступать непосредственно из оперативных источников (независимый киоск).

Основные компоненты DW:

оперативные источники данных;

• средства проектирования/разработки;

• средства переноса и трансформации данных;

• СУБД;

• средства доступа и анализа данных;

• средства администрирования.

Сферы применения DW:

Сегментация рынка.

• Планирование продаж, прогнозирование и управление.

• Забота о клиенте.

• Разработка схем лояльности.

• Проектирование и разработка новых видов продукции.

• Интеграция цепочки поставок.

• Интеллектуальные технологии в организации бизнеса.

Программное обеспечение технологии DW. Процессы создания, поддержки и использования хранилищ данных традиционно требовали значительных затрат, что в первую очередь было вызвано высокой стоимостью доступных на рынке специализированных инструментов. Эти инструменты практически не интегрировались между собой, так как были основаны не на открытых и стандартных, а на частных и закрытых протоколах, интер­фейсах и т.д. Сложность и дороговизна делали практически невозможным построение хранилищ данных в небольших и средних фирмах, в то время как потребность в анализе данных испытывает любая фирма, независимо от масштаба.

Корпорация Microsoft создала Microsoft Data Warehousing Framework - спецификацию среды создания и использования хранилищ данных. Данная спецификация определяет развитие не только новой линии продуктов Microsoft (например, Microsoft SQL Server 7.0), но и технологий, обеспечивающих интеграцию продуктов различных производителей. Открытость среды Microsoft Data Warehousing Framework обеспечила ее поддержку многими производителями ПО, что, в свою очередь, дает возможность конечным пользователям выбирать наиболее понравившиеся им инструменты для построения своих решений.

Основные поставщики ПО хранилищ данных: Arbor; Hewlett-Packard; IBM; Informix; Microsoft; Oracle; Platinum Technology; SAS Institute; Soft­ware AG; Sybase и др.

Все эти фирмы имеют страницы в Internet, где приводятся подробные сведения об их продуктах и услугах.


 

– Конец работы –

Эта тема принадлежит разделу:

Информационные технологии в экономике: Учеб. пособие З.В.Архипова,В.А.Пархомов Иркутск: Изд-во БГУЭП, 2003

ОГЛАВЛЕНИЕ... ВВЕДЕНИЕ ОРГАНИЗАЦИОННЫЕ ОСНОВЫ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Технология хранилищ данных Data Warehousing

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ОРГАНИЗАЦИОННЫЕ ОСНОВЫ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ЭКОНОМИКЕ
1.1. Информационные процессы в экономике и новая роль информационных систем 1.1.1. Информационные процессы в экономике. Основные понятия курса 1.1.2. Социальные и этичес

ТЕХНИЧЕСКИЕ ОСНОВЫ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ЭКОНОМИКЕ
2.1. Аппаратное обеспечение информационных технологий 2.1.1. Компьютеры и информационные процессы 2.1.2. Основные компоненты персонального компьютера (ПК) 2

Технологий
  Под воздействием информационных технологий меняются формы эко­номической деятельности, виды и типы предприятий и организаций, характер взаимоотношений между работодателями и служащи

Перестройка бизнеса и управления
  К основным изменениям, характеризующим современную экономику, относятся: · Глобализация (конкуренция на мировых рынках, глобальные группы производителей, глобальные системы

Применение информационных систем для получения конкурентных преимуществ
  Как уже отмечалось ранее, ИС сегодня играют стратегическую роль, так как помогают организации получить конкурентные преимущества. Информационная технология и ИС сами по себе не дают

Организации. Типы организации.
  Организации — это совокупность людей и групп, объединенных для достижения какой-либо цели, решения какой-либо задачи на основе правил и процедур, разделения тру

Влияние ИС на организации с точки зрения различных экономических теорий
  Различные экономические теории признают значимость и необходимость применения ИС. В табл.5 приведены точки зрения различных эко­номических теорий.   Таблица 5

Потребительской стоимости
  Экономическая ситуация в России и складывающиеся рыночные отно­шения требуют пересмотра принципов и механизмов управления на уровне каждого предприятия. Сегодня система управления п

Информация, управление и принятие решений
  Практика управления имеет такую же древнюю историю, как и сами организации, но управление стало признанной и широко распространенной научной дисциплиной только начиная с 1910 г.

Компьютеры и информационные процессы
  Техническую основу обеспечения информационных технологий со­ставляют средства компьютерной техники, средства коммуникационной техники и средства организационной техники. Ср

Основные компоненты персонального компьютера (ПК)
  Персональный компьютерпредставляет собой универсальную техническую систему. Его конфигурацию (состав оборудования) можно гибко изменять по мере необходимости. Сущес

Периферийные устройства персонального компьютера.
Периферийные устройства персонального компьютера подключаются к его интерфейсам и предназначены для выполнения вспомогательных операций. Благодаря им компьютерная система приобретает гибкость и уни

Структура программного обеспечения
  Программное обеспечение (ПО) компьютера называют мягким оборудованием или SOFTWARE. В зависимости от функций, выполняемых программным обеспечением, его можно разделить на 2

Краткий обзор современных операционных систем.
  В настоящее время существует большое количество операционных систем и постоянно появляются новые, учитывающие недостатки и рас­ширяющие возможности предшествующих. Многие из ОС не п

Краткий обзор прикладного программного обеспечения
  К прикладному программному обеспечению относится программное обеспечение общего назначения и программное обеспечение функцио­нального назначения. Пакеты программ об

Модели данных
  В экономике существуют объекты, предметы, информацию о которых необходимо хранить, и эти объекты связаны между собой самыми разными способами. Чтобы область хранения данных рассматр

Системы управления базами данных
  Обработка данных средствами СУБД. Добавление, удаление, изменение и выборка данных производится при помощи языка запросов, встроенного алгоритмического языка и других средств

Тенденции и перспективы развития технологий управленияресурсами данных
  Перспективы развития архитектур СУБД связаны с развитием концепции обработки нетрадиционных данных и их интеграции, обмена данными из разных СУБД, многопользовательской технологии в

Технология анализа OLAP
  В предыдущем разделе были подробно рассмотрены технологии хранилищ данных. Теперь перейдем к следующему этапу. После того как данные получены, очищены, приведены к единому виду и по

Телекоммуникационная революция
  Основоположник идеологии информационного общества Д.Белл в книге "Социальные рамки информационного общества" большое значение придает конвергенции электронно-вычислительно

Компоненты и функции телекоммуникационных систем
  Любые виды сообщений передаются с помощью сигналов. Сигналы могут быть звуковые, световые, тепловые и другие, но сообщения передаются преимущественно электрическими сигналами с помо

Технологии распределенной обработки данных. Модель клиент-сервер
  Информационные системы, построенные на базе компьютерных сетей, обеспечивают решение следующих задач: хранение данных, обработка данных, организация доступа пользователей к данным,

Эталонная модель взаимодействия открытых систем
  Протоколы - это специальные стандарты, которые обеспечивают со­вместимость программ и данных (программы поддержки протоколов) и аппаратных средств (аппар

Структура, информационные ресурсы и принципы работы всети Интернет
  Интернет — это всемирная компьютерная сеть, объединяющая миллионы компьютеров по всему миру. Фактически Интернет является конгломератом многих глобальных, регио

Информационные технологии электронного бизнеса
  Сегодня мы становимся свидетелями рождения нового сектора в эко­номике, который все чаще называют электронным бизнесом, Интернет-экономикой, Интернет-бизнесом, электронной коммерцие

Информационная безопасность — составляющая экономической безопасности
  Становление рыночной экономики в России породило ряд проблем. Одной из таких проблем является обеспечение безопасности бизнеса. На фоне высокого уровня криминализации общества, проб

Концептуальная модель защиты информации
  Для организации системы защиты на конкретном предприятии необхо­димо провести анализ источников и видов информации, требующих защи­ты, выполнить анализ угроз безопасности и возможны

Требования, принципы и модель системы защиты информационной системы
  Под системой защиты информационной системы понимается совокупность органов и исполнителей, используемой ими техники защиты инфор­мации, а также объектов защиты, организованная и фун

Методы и способы защиты
  На каждом предприятии, независимо от его размеров, вида собственности и направления деятельности применяются однотипные методы и способы защиты, реализующие модель системы защиты. Б

Криптография с публичным ключом и электронная цифровая подпись
  Защита информации особенно актуальна в электронном бизнесе. Здесь возникают проблемы не только защиты данных при передаче по каналам связи от перехвата, подделки или уничтожения, но

Правовая защита информации
  Среди различных методов защиты информации, особая роль отводится правовой защите. При всех своих возможностях и обязательности исполь­зования, физические и программно-технические сп

Реструктуризация управления
  В постоянно изменяющихся экономических условиях, существует необходимость в инструментах и методах, которые могут помочь организациям стать более эффективными. В мире конкуренции су

Управление и реинжиниринг бизнес-процессов
  Изменения в управлении происходят параллельно с внедрением информационных технологий. Необходимо отметить, что информационная архитектура должна соответствовать бизнес-архитектуре о

Традиционные и альтернативные системы построения ИС
  В основе деятельности по созданию и использованию информационной системы на предприятии лежит понятие ее жизненного цикла (ЖЦ). ЖЦ является моделью создания и использования информац

Проектирование ИС. Методологии разработки систем
  Функциональное моделирование является важным элементом анализа, который выполняется на начальном этапе проектирования любой автоматизированной информационной системы, в том числе и

Постановка экономической задачи
  В курсовом проекте или лабораторной работе разрабатывается и решается на компьютере задача пользователя. Основными теоретическими раз­делами, составляющими базу курсового проектиров

Понятие корпоративных информационных систем (КИС)
Рассматривая классификацию информационных систем, мы отмечали, что наибольший эффект дает применение интегрированных систем, охватывающих все сферы деятельности предприятия, и что информационная си

Краткий обзор российского рынка систем управления предприятием
  В настоящее время на российском рынке информационных систем управления предприятием можно выделить три группы. Первая группа — это крупные интегрированные пакеты зарубежных

Технология поддержки стратегического корпоративного планирования
  Пришедшие на смену распределительным принципам организации и планирования рыночные отношения заставили руководителей большинства предприятий пристальнее изучать мировой опыт. Обраща

Системы поддержки аналитических исследований
  Потребность в аналитических программах для рынка реальных инвестиций не оказалась не замеченной. В настоящее время разработкой таких программ заняты около десятка фирм. Сег

Экспертные системы
  Постоянно возрастающие требования к средствам обработки информации в экономике и социальной сфере стимулировали компьютеризацию процессов решения эвристических (неформализованных) з

Справочно-правовые системы
  Любая предпринимательская деятельность немыслима без оперативной юридической поддержки. Учитывая большое количество издаваемых в по­следние годы нормативных актов, постоянного внесе

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги