Проверка правила сложения дисперсий и оценка степени влияния факторного признака на величину результативного.

Правило сложения дисперсий заключается в равенстве общей дисперсии сумме средней из внутригрупповых и межгрупповой дисперсий, т.е.:

, (42)

где общая дисперсия; (43)

внутригрупповые дисперсии; (44)

средняя из внутригрупповых дисперсий; (45)

межгрупповая дисперсия; (46)

внутригрупповые средние; (47)

общая средняя. (48)

Значение общей средней приведено в ячейке D65, а в ячейках D66 и D67 – среднее квадратическое отклонение и дисперсия зависимой переменной. Групповые средние приведены в ячейках АУ3:АУ7. Внутригрупповые дисперсии вычисляются с использованием функции ДИСПР, например, в ячейке АК3 записана формула = ДИСПР (С10:С15). Средняя из внутригрупповых дисперсий отображена в ячейке D68, в которой записана формула:

= СУММПРОИЗВ (АК3:АК7;Х3:Х7).

Для вычисления межгрупповой дисперсии в ячейку D69 записана формула = СУММПРОИЗВ (СТЕПЕНЬ(AJ3:АJ7-$D$65;2);X3:X7).

Как следует из данных табл. 2 правило сложения дисперсий выполняется, т.к. 11,25=1,62+9,63.

Для того, чтобы выяснить влияет ли контролируемый фактор на результативный признак, а при наличии такого влияния оценить его степень можно применить однофакторный дисперсионный анализ. Его логика рассуждений сводится к следующему:

Пусть - математическое ожидание результативного признака, соответственно в группах . Если при изменении уровня фактора групповые математические ожидания не изменяются, то результативный признак не зависит от фактора А, в противном случае такая зависимость имеется.

В связи с тем, что числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы

 

Проверить данную гипотезу можно при соблюдении следующих требований при каждом значении уровня фактора:

1) наблюдения независимы и проводятся в одинаковых условиях;

2) результативный признак имеет нормальный закон распределения с постоянной для различных уровней генеральной дисперсией.

Для ответа на второй вопрос вычислим значения относительных показателей асимметрии и эксцесса (ячейки В71, В72). Учитывая, что каждый из них меньше 1,5 эмпирическое распределение прибыли банков не противоречит нормальному. Проверим выполнение гипотезы:

(49)

с помощью критерия Бартлетта:

(50)

где ; (51)

l=n-m; ; (52)

; (53)

; (54)

k=m-1; (55)

- дисперсия в j-ой группе;

-выборочная дисперсия в j-ой группе. (56)

При выполнении гипотезы о равенстве дисперсий, величина w имеет распределение близкое к с к=m- степенями свободы.

При соблюдении условия

гипотеза (49) подтверждается.

Здесь - правосторонняя критическая точка при заданном уровне значимости , определяющая критический интервал ( ).

Проверка гипотезы о равенстве математических ожиданий основывается на сравнении оценок и . В математической статистике доказывается, что если гипотеза о равенстве математических ожиданий подтверждается, то величина

(57)

имеет F – распределения с числом свободы k=m-1 и =n-m, т.е.

 

При использовании F – критерия строится правосторонняя область ( ), т.к. обычно . Если расчетное значение F – критерия попадает в указанный интервал, то гипотеза о равенстве групповых математических ожиданий отвергается, т.е. считаем, что фактор А влияет на результативный признак Y и можно измерить степень этого влияния с помощью выборочного коэффициента детерминации.

Рассчитаем значение перечисленных показателей. В ячейке D72 записана формула =n-m, т.е. вычисляется значение ;

Ячейка D73 содержит формулу =СУММПРОИЗВ(СТЕПЕНЬ(W3:W7-1;(-1))) – вычисляется значение ;

Ячейка D74: =1/D72 – вычисляется значение ;

Ячейка D75: =СУММПРОИЗВ(W3:W7;AK3:AK7)*D74 – вычисляется значение ;

Ячейка D76: =1+(D73-D74)/(3*4) – вычисляется значение q;

Ячейка D77: =СУММПРОИЗВ(W3:W7-1;LN($D$75/AZ6:AZ10))/D76 – вычисляется значение критерия Бартлетта;

Ячейка D78: =ХИ20БР(0,05;4) – определяется значение правосторонней критической точки .

В связи с тем, что =4,18 не попадает в критическую область (9,49; ), то гипотеза принимается и можно приступить к проверке гипотезы . Для этого сформируем массив значений результативного признака по группам (табл. 8).

 

Обратимся к режиму работы «Однофакторный дисперсионный анализ». Значения параметров, установленные в одноименном диалоговом окне, показаны на рис. 15.