Методы Бокса-Дженкинса (ARIMA)

В середине 90-х годов прошлого века был разработан принципиально новый и достаточно мощный класс алгоритмов для прогнозирования временных рядов. Большую часть работы по исследованию методологии и проверке моделей была проведена двумя статистиками, Г.Е.П. Боксом (G.E.P. Box) и Г.М. Дженкинсом (G.M. Jenkins). С тех пор построение подобных моделей и получение на их основе прогнозов иногда называться методами Бокса-Дженкинса. Самым известным и используемым из них является алгоритм ARIMA. Он встроен практически в любой специализированный пакет для прогнозирования. Например, в пакет Statistica-7 и в пакет MatLab 8 (Econometrics Tool). В классическом варианте ARIMA не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В отличие от рассмотренных ранее методик прогнозирования временных рядов, в методологии ARIMA не предполагается какой-либо четкой модели для прогнозирования данной временной серии. Задается лишь общий класс моделей, описывающих временной ряд и позволяющих как-то выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования.

- AR(p) -авторегрессионая модель порядка p.

Модель имеет вид:

где - зависимая переменная в момент времени t.

- оцениваемые параметры. - ошибка от влияния переменных, которые не учитываются в данной модели.

Задача заключается в том, чтобы определить . Их можно оценить различными способами. Правильнее всего искать их через систему уравнений Юла-Уолкера, для составления этой системы потребуется расчет значений автокорреляционной функции. Можно поступить более простым способом - посчитать их методом наименьших квадратов.

Термин авторегрессия для обозначения модели (1.6) используется потому, что она фактически представляет собой модель регрессии, в которой регрессорами служат лаги изучаемого ряда . По определению авторегрессии ошибки E_t являются белым шумом и некоррелированы с лагами . Таким образом, выполнены все основные предположения регрессионного анализа: ошибки имеют нулевое математическое ожидание, некоррелированы с регрессорами, не автокоррелированы и гомоскедастичны. Следовательно, модель (1.6) можно оценивать с помощью обычного метода наименьших квадратов. Отметим, что при таком оценивании p начальных наблюдений теряются.

- MA(q) -модель со скользящим средним порядка q.

Модель имеет вид:

Где - зависимая переменная в момент времени - оцениваемые параметры.

- Смешанные процессы авторегрессии -скользящего среднего ARMA (модель Бокса—Дженкинса)

На практике иногда бывает целесообразно ввести в модель как элементы авторегрессии, так и элементы скользящего среднего. Это делается для того, чтобы с использованием как можно меньшего числа параметров уловить характеристики исследуемого эмпирического ряда. Такой процесс называется смешанным процессом авторегрессии — скользящего среднего и обозначается ARMA(p, q):

Для выбора параметров p и q используют функцию автокорреляции и частную автокорреляционную функцию.

Значения параметров модели подбираются путем минимизации суммы квадратов ошибок. В общем случае для реализации этой процедуры должен применяться нелинейный метод наименьших квадратов.

После завершения процедуры минимизации ошибок и определения стандартной ошибки проводится стандартный анализ модели на значимость полученных коэффициентов и адекватность самой модели. В целом модель является адекватной, если полученные остатки нельзя использовать для дальнейшего уточнения прогнозов. Иначе говоря, адекватными моделями считаются такие, у которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.

Критерий Дарбина-Уотсона является наиболее распространенным критерием для проверки корреляции внутри ряда. Если величина

, где - расхождение между фактическими и расчетными уровнями, имеет значение, близкое к 2, то можно считать модель достаточно адекватной. Когда адекватная модель найдена, можно делать прогнозы на один или несколько периодов вперед.