Непараметрические тесты стационарности

Параметрические критерии проверки стационарности достаточно неудобны в практических исследованиях и весьма ограничены в применении из-за своих достаточно строгих предположений относительно нормальности закона распределения временного ряда уt, t=1,2,... . Они требуют значительных вычислений. Вместе с тем, реальные временные ряды могут быть распределены по закону, отличающемуся от нормального, и, как это будет показано далее, условие нормальности распределения ряда уt не является обязательным при построении эконометрических моделей, описывающих такие ряды.

Вследствие этого на практике при проверке свойств стационарности процессов часто используются непараметрические критерии, которые не имеют подобных ограничений по закону распределения временного ряда уt, да и не столь сложны по своим вычислениям.

Тест Манна-Уитни (тестирование математического ожидания).

В частности, вместо критерия Стьюдента может быть использован непараметрический критерий Манна-Уитни (критерий и*). Он чуть слабее критерия Стьюдента в случае временных рядов с нормальным распределением, однако имеет неоспоримые преимущества по сравнению с параметрическими критериями в случае, если распределение временного ряда отличается от нормального.

Критерий и* применяется для проверки идентичности распределений двух совокупностей (в нашем случае, временных последовательностей одного временного ряда уt, определенных на разных временных частях интервала t=1,..., Т).

Предположим, что первая совокупность образована Т1 последовательными значениями уt, а вторая – Т2 его последовательными значениями, и эти последовательности не пересекаются.

Все значения этих совокупностей объединяются в один ряд, в котором они располагаются в порядке возрастания с первого по (Т1+Т2)-й вне зависимости от принадлежности к той или иной последовательности. Вместе с тем, в этой единой последовательности символом у1 отметим элементы первой последовательности, а символом у2 – второй. В результате формируется структурный временной ряд, состоящий из Т1+Т2 элементов, в котором символы у1 (Т1 элементов) и символы у2 (Т2 элементов) оказываются перемешанными между собой.

Для сформированного таким образом временного ряда возможно различных структур, под которыми понимаются последовательности с различающимися порядками следования элементов из первой и второй совокупностей. Иными словами, структуры, у которых изменились места элементов одной и той же совокупности различными не считаются.

Логика теста состоит в следующем. Если ряд стационарный, то последовательности у1 и у2 практически не отличаются одна от другой и их элементы перемешаны между собой. При этом появление каждой из возможных структур имеет равную вероятность. Если же ряд отличается от стационарного, то общая последовательность будет разделена на более или менее однородные массивы, состоящие в основном из единиц той или иной совокупности. Например, элементы совокупностей будут скапливаться на разных концах общей последовательности. Такие структуры в случае, например, увеличивающегося (или уменьшающегося) нестационарного временного ряда будут иметь большую вероятность появления.

Соответствующий тест Манна-Уитни осуществляет проверку гипотезы о стационарности временного ряда уt на основе расчета статистики и* (значения критерия), представляющей собой число случаев, когда элементы из совокупности у1 предшествуют элементам совокупности у2. Иными словами, значение и* равно количеству элементов из у1, предшествующих наименьшему по величине элементу из у2, плюс количество элементов из у1, предшествующих следующему за ним элементу из у2, включая и ранее уже учтенные элементы первой совокупности и т. д., пока не будет включено в сумму количество элементов из у1, предшествующих последнему элементу из у2.

На практике значение и* рассчитывается либо через сумму рангов элементов первой совокупности, либо через сумму рангов элементов второй совокупности, с которыми оно связано следующими соотношениями:

 

 

где R1 и R2 – суммы рангов элементов первой и второй совокупностей соответственно, определяемых по их общей последовательности.

Для больших последовательностей (Т>50; 100) случайная величина и* распределена по нормальному закону с математическим ожиданием

и дисперсией

 

Таким образом, случайная величина z, определяемая как

 

 

является нормированной величиной с нулевым средним и единичной дисперсией, распределенной по стандартизованному нормальному закону, z~N(0,1).

В формуле (6.31) поправка 1/2 вводится для обеспечения непрерывности величины z. Она прибавляется, если z<0, и вычитается, при z>0.

Таким образом, если обе совокупности идентичны, и их элементы будут перемешаны между собой, то можно ожидать, что значения и* будут находиться недалеко от своего среднего уровня (соответственно z – около нуля). Гипотеза о стационарности процесса уt, t=1,2,..., Т в этом случае может быть принята с доверительной вероятностью p*, если будет выполнено следующее неравенство

 

где х1 и х2 определяются из следующего равенства:

х2

ò

х1

 

где

В частности, при p*=0,95, расчетное значение z должно находиться в следующем интервале:

 

–1,96£ z£1,96.

 

Тест Сиджела-Тьюки.

Вместо параметрического критерия Фишера (F-критерия) для проверки гипотезы о постоянстве дисперсии временного ряда уt на интервале t=1,2,...,Т может быть использован непараметрический критерий Сиджела-Тьюки, который также основан на сопоставлении рангов элементов двух совокупностей из рассматриваемого интервала.

Тест проверки этой гипотезы состоит в следующем. Исходный временной ряд уt, t=1,2,...,Т центрируется, т. е. определяются значения , где – среднее значение ряда уt. Далее интервал (1,Т) разделяется на две части (желательно равные), так что на первой из них располагаются элементы первой центрированной совокупности у1, а на второй – элементы второй совокупности – у2. Далее элементы из двух центрированных совокупностей у1 и у2 объединяются в одной таблице с запоминанием “своей совокупности” согласно следующему правилу ранжирования. Ранг 1 приписывается наименьшему отрицательному значению, которое располагается на первом месте вверху таблицы. Ранг 2 приписывается наибольшему положительному значению, которое располагается на последнем месте внизу таблицы. Ранг 3 приписывается значению следующему за наименьшим, которое располагается на втором месте вверху таблицы. Ранг 4 – значению, следующему за наибольшим, которое располагается в таблице на втором месте снизу. Ранг 5 приписывается третьему по порядку наименьшему значению. Оно располагается в таблице на третьем месте сверху. Ранг 6 приписывается третьему по порядку наибольшему значению, которое располагается на третьем месте таблицы снизу и т. д.

Таким образом, в таблице номера рангов увеличиваются от краев к центру согласно следующей закономерности: нечетные номера (отрицательных элементов) – сверху к центру; четные (положительных элементов) – снизу к центру.

Рассчитанная на основе этих рангов случайная величина w* оказывается приблизительно распределенной по нормальному закону с математическим ожиданием, оцениваемым как

 

и дисперсией

 

где R1 – сумма рангов элементов первой совокупности у1, Т1+Т2 – количество элементов в первой и второй совокупности соответственно.

Из выражений (6.33) и (6.34) непосредственно следует, что нормированная случайная величина z, определяемая как

 

 

распределена по нормальному стандартизованному закону с нулевым средним и единичной дисперсией. Здесь также поправка 1/2 вводится для обеспечения непрерывности z. Она добавляется при z<0, и вычитается при z>0.

Гипотеза о равенстве дисперсий рассмотренных совокупностей принимается, если для z удовлетворяется соотношение (6.32).

Сериальные критерии стационарности.

Для проверки гипотезы о стационарном характере процесса (имеется в виду стационарность второго порядка) может быть использованы достаточно универсальные относительно закона распределения значений ряда уt, t=1,2,..., Т непараметрические тесты, основанные на анализе закономерностей серий этих значений (сериальные критерии). Необходимым условием их применения является достаточно большой объем временного ряда, что позволяет с определенной обоснованностью считать обнаруженные закономерности устойчивыми (характерными для данного ряда). При этом серией называют последовательность значений, предшествующая или следующая за некоторым значением, характерный признак которого отличается от признака элементов, входящих в серию. В качестве такого признака часто рассматривается расположение элемента последовательности относительно ее медианы. В этом случае серии с положительным знаком образуют элементы по уровню выше медианы, и серии с отрицательным знаком – элементы, чей уровень не превосходит медианы. Здесь следует иметь в виду, что один элемент – это тоже серия.

Примером сериального критерия является критерий Вальда-Вольфовитца, основанный на подсчете общего числа серий. Среднее значение числа серий определяется согласно следующему выражению:

 

а его дисперсия – согласно формуле

 

 

где N1 – количество элементов с положительным знаком; N2 – количество элементов с отрицательным знаком. N1+N2=Т – количество элементов во временном ряду. Ns – число серий.

При большом объеме временного ряда Т нормированная переменная z , определяемая как

 

 

распределена по стандартизованному нормальному закону N(0,1).

В этом случае для проверки гипотезы о стационарности используется двухсторонний критерий (6.32).