рефераты конспекты курсовые дипломные лекции шпоры

Раздел Информатика
/
Методы Бокса-Дженкинса (ARIMA)

Реферат Курсовая Конспект

Выберите учебное заведение

Методы Бокса-Дженкинса (ARIMA)

Методы Бокса-Дженкинса (ARIMA) - раздел Информатика, Інформаційні системи та технології в управлінні В Середине 90-Х Годов Прошлого Века Был Разработан Принципиально Новый И Дост...

В середине 90-х годов прошлого века был разработан принципиально новый и достаточно мощный класс алгоритмов для прогнозирования временных рядов. Большую часть работы по исследованию методологии и проверке моделей была проведена двумя статистиками, Г.Е.П. Боксом (G.E.P. Box) и Г.М. Дженкинсом (G.M. Jenkins). С тех пор построение подобных моделей и получение на их основе прогнозов иногда называться методами Бокса-Дженкинса. Самым известным и используемым из них является алгоритм ARIMA. Он встроен практически в любой специализированный пакет для прогнозирования. Например, в пакет Statistica-7 и в пакет MatLab 8 (Econometrics Tool). В классическом варианте ARIMA не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В отличие от рассмотренных ранее методик прогнозирования временных рядов, в методологии ARIMA не предполагается какой-либо четкой модели для прогнозирования данной временной серии. Задается лишь общий класс моделей, описывающих временной ряд и позволяющих как-то выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования.

- AR(p) -авторегрессионая модель порядка p.

Модель имеет вид:

где - зависимая переменная в момент времени t.

- оцениваемые параметры. - ошибка от влияния переменных, которые не учитываются в данной модели.

Задача заключается в том, чтобы определить . Их можно оценить различными способами. Правильнее всего искать их через систему уравнений Юла-Уолкера, для составления этой системы потребуется расчет значений автокорреляционной функции. Можно поступить более простым способом - посчитать их методом наименьших квадратов.

Термин авторегрессия для обозначения модели (1.6) используется потому, что она фактически представляет собой модель регрессии, в которой регрессорами служат лаги изучаемого ряда . По определению авторегрессии ошибки E_t являются белым шумом и некоррелированы с лагами . Таким образом, выполнены все основные предположения регрессионного анализа: ошибки имеют нулевое математическое ожидание, некоррелированы с регрессорами, не автокоррелированы и гомоскедастичны. Следовательно, модель (1.6) можно оценивать с помощью обычного метода наименьших квадратов. Отметим, что при таком оценивании p начальных наблюдений теряются.

- MA(q) -модель со скользящим средним порядка q.

Модель имеет вид:

Где - зависимая переменная в момент времени - оцениваемые параметры.

- Смешанные процессы авторегрессии -скользящего среднего ARMA (модель Бокса—Дженкинса)

На практике иногда бывает целесообразно ввести в модель как элементы авторегрессии, так и элементы скользящего среднего. Это делается для того, чтобы с использованием как можно меньшего числа параметров уловить характеристики исследуемого эмпирического ряда. Такой процесс называется смешанным процессом авторегрессии — скользящего среднего и обозначается ARMA(p, q):

Для выбора параметров p и q используют функцию автокорреляции и частную автокорреляционную функцию.

Значения параметров модели подбираются путем минимизации суммы квадратов ошибок. В общем случае для реализации этой процедуры должен применяться нелинейный метод наименьших квадратов.

После завершения процедуры минимизации ошибок и определения стандартной ошибки проводится стандартный анализ модели на значимость полученных коэффициентов и адекватность самой модели. В целом модель является адекватной, если полученные остатки нельзя использовать для дальнейшего уточнения прогнозов. Иначе говоря, адекватными моделями считаются такие, у которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.

Критерий Дарбина-Уотсона является наиболее распространенным критерием для проверки корреляции внутри ряда. Если величина

, где - расхождение между фактическими и расчетными уровнями, имеет значение, близкое к 2, то можно считать модель достаточно адекватной. Когда адекватная модель найдена, можно делать прогнозы на один или несколько периодов вперед.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Інформаційні системи та технології в управлінні

україни... Запорізький національний технічний університет... Інформаційні системи та технології в управлінні МЕТОДИЧНІ ВКАЗІВКИ...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Методы Бокса-Дженкинса (ARIMA)

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Определение СППР
Информационные системы являются в наше время неотъемлемой частью технологий управления бизнесом. Практически на каждом предприятии работают информационные системы, осуществляющие функции учета и ко

Архитектура СППР
Рисунок 1 - Обобщенная архитектура системы поддержки принятия решений Поддержка принятия решений на основе накопленных да

Online Analytical Processing
Любая система поддержки принятия решений, прежде всего, должна обладать средствами отбора и предоставления пользователю данных в удобной для восприятия и анализа форме. Как правило, наиболее удобны

Knowledge Discovery in Databases
KDD (Knowledge Discovery in Databases) – извлечение знаний из баз данных. Это процесс поиска полезных знаний в «сырых данных». KDD включает в себя вопросы подготовки данных, выбора информативных пр

Data Mining
DM (Data Mining) – «добыча» данных. Это метод обнаружения в «сырых» данных ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для принятия реше

Принципы организации хранилища
1. Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют. 2.

Анализ данных с помощью кросс-таблиц и визуализации
Технология комплексного многомерного анализа данных и предоставления результатов этого анализа в удобной для использования форме получила название OLAP. OLAP (Online Analytical Processing)

Теоретические сведения
Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов. Принцип корреляционного анализа состоит в поиске таких значений,

Теоретические сведения
Рассмотрим методы, которые используются для прогнозирования неопределенного будущего с целью помочь менеджерам в принятии наилучшего решения. Эти методы состоят в изучении и анализе накопленных дан

Компьютерные пакеты для решения задач прогнозирования
Таблица 2.1 – Классификация программных продуктов для расчетов прогнозов Название инструмента Сфера применения Реализуемые модели

Временные ряды
Информационной базой для анализа экономических процессов являютсядинамические и временные ряды. Совокупность наблюдений некоторого явления (показателя), упорядоченная в зависимости от последователь

Основные описательные статистики для временных рядов.
Среднее и дисперсия временного ряда рассчитываются по формулам: . Выборочная автоковариация k-го порядка вычисляетс

Средние и скользящие средние
Самой простой моделью, основанной на простом усреднении, является Y(t+1)=(1/(t))*[Y(t)+Y(t-1)+...+Y(1)], и в отличие от самой простой "наивной" модели, которой

Моделирование временного ряда
В общем случае каждый уровень временного можно представить как функцию четырех компонент: f(t), S(t), U(t),

Нейросетевые модели прогнозирования
В настоящее время, на наш взгляд, самым перспективным количественным методом прогнозирования является использование нейронных сетей. Можно назвать много преимуществ нейронных сетей над остальными а

Предобработка данных
На практике большинство прогнозируемых временных рядов порождаются сложными динамическими системами, с множеством степеней свободы. Кроме того, в самом временном ряде может присутствовать случайная

Импорт данных из файла
Импорт осуществляется путем вызова Мастера импорта на панели "Сценарии". После запуска Мастера импорта укажем тип импорта "Текстовый файл с разделителями" и перейдем к настройке

Настройка параметров столбцов
На этом шаге Мастера предоставляется возможность настроить параметры каждого поля: имя, метку, размер, тип данных, вид данных и назначение. Некоторые свойства (например, тип данных) можно задавать

Расчет автокорреляции столбцов
Важным фактором для анализа временного ряда и прогноза является определение сезонности. В Deductor Studio инструментом, предназначенным для изучения сезонности, является автокоррел

Удаление аномалий
Присутствие аномалий при построении моделей оказывает на них большое влияние, ухудшая качество результата. Как видно из диаграммы, выбросы ухудшают статистическую картину распределения данных. Восп

Преобразование данных к скользящему окну
Когда требуется прогнозировать временной ряд, тем более, если налицо его периодичность (сезонность), то лучшего результата можно добиться, учитывая значения факторов не только в данный момент време

Обучение линейной регрессии
Для построения линейной регрессии необходимо запустить Мастер обработки и выбрать в качестве обработки данных Линейную регрессию. На первом шаге задаем назначение исходных столбцов. Предпо

Прогнозирование с помощью нейронных сетей
Прогнозирование результата на определенное время вперед, основываясь на данных за прошедшее время, – задача, встречающаяся довольно часто. К примеру, перед большинством торговых фирм стоит задача о

Теоретические основы
Кластерный анализ представляет собой статистические методы, используемые для классификации многомерных объектов или событий в относительно однородные группы, которые называют кластерами. Объ

Меры близости в алгоритмах кластеризации
Расстояния между объектами предполагают их представление в виде точек m-мерного пространства Rm. В этом случае могут быть использованы различные подходы к вычислению расстояний.

Иерархические методы кластерного анализа
Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие. Иерархические агломеративные методы (Agglom

Алгоритм k-means
Конструктивно алгоритм представляет собой итерационную процедуру следующего вида. 1. Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки. 3.

Кластеризация
Вначале необходимо осуществить импорт рассматриваемых данных из файла. После этого выбираем и запускаем Мастер обработки "Кластеризация". При запуске Мастера необходимо настроить

Постановка задачи
В коммерческий банк ОАО «Друг» обратились руководители 12 крупных предприятий города А с просьбой о предоставлении кредита. Специалисты кредитного отдела банка с целью принятия надежного решения (т

Решение
1. Скопировать данные табл. 3.1 в файл STATISTICA. 2. Открыть меню«Статистика» (Statistics), в нем выбрать«Многомерные исследовательские

Обзор литературы по Data Mining
1) А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод Методы и модели анализа данных: OLAP и Data Mining (+ CD-ROM)