Однофакторный дисперсионный анализ.

В дисперсионном анализе исследуется влияние одного или несколь­ких качественных показателей на количественный показатель.

В однофакторном дисперсионном анализе на одну количественную переменную Y оказывает влияние один фактор (один качественный пока­затель), наблюдаемый на k уровнях, то есть имеем k выборок для пере­менной Y.

Наблюдаемые данные обозначим yij, где i - индекс уровня (i = 1,2,...,k), j - индекс наблюдения на i-м уровне ( j = 1,...,ni).

На каждом уровне может быть свое число наблюдений ni.

Общее число опытов (наблюдений)

По данным yij определяются следующие характеристики:

- среднее значение переменной Y на i -м уровне

;

- среднее значение переменной Y по всем значениям

S2 - сумму квадратов отклонений наблюдений от общего среднего

- сумму квадратов отклонений средних групповых значений от общего среднего значения

- остаточную сумму квадратов отклонений

Справедливо соотношение:

Соответствующие суммы квадратов отклонений, отнесенные к числу степеней свободы, представляют собой несмещенные оценки соответствующих дисперсий.

Далее выполняются следующие действия:

вычисление общей дисперсии

вычисление факторной дисперсии ;

вычисление остаточной дисперсии .

В дисперсионном анализе проверяется гипотеза Н0 о равенстве средних групповых значений количественного показателя:

Критерием для проверки этой гипотезы является соотношение факторной дисперсии иостаточной дисперсии:

Пример.Исследовалось влияние индивидуальных качеств (особенностей, заслуг) продавцов на объемы выручки магазина. Получены следующие данные:

Номера продавцов Число отрабо­танных дней Дневная выручка магазина (тыс. долл.)
16.5; 15.0; 16.2; 18.9; 20.1; 19.3; 10.1; 12.8
16.7; 16.3; 14.0; 15.0; 16.7; 12.4; 7.9; 9.8; 14.4; 10.8; 11.1;13.0; 10.7
10.7; 9.0; 13.9; 11.3; 9.4; 11.9; 10.5; 9.7; 7.4

 

Определить, влияют ли индивидуальные качества продавцов на объемы выручки магазина?

Решение.По имеющимся данным уij определим средние значения дневной выручки (переменной Y) на каждом (из трех) i-ом уровне:

.

Получим = 16.11; = 12.98; = 10.44.

Среднее значение переменной Y по всем значениям

Результаты других расчетов сведены в табл.3.

Таблица 3.

Результаты расчета примера однофакторного дисперсионного анализа

Источник изменчивости Сумма квадратов отклонений Число степеней свободы   Дисперсия   FH
Факторная (систематическая) 131.67 65.83 8.46
Случайная составляющая 210.05 7.78  
Общая изменчивость 341.72    

Критическое значение находим по таблицам квантилей F - распределения при уровне значимости = 0.05, что соответствует квантилю по­рядка 0.95.

Fkp = F(0.95; 2; 27) = 3.35.

Так как FH > Fkp , то гипотеза Н0 о равенстве дневной выручки у каждого продавца отвергается, и принимается конкурирующая гипотеза H1 - средние выручки продавцов (на различных уровнях) различны. Это означает, что индивидуальные качества (особенности) продавцов влияют на объемы выручки магазина.

Пример. Катализатор для химической реакции получался четырьмя различными способами. В экспериментах проверялась активность катализатора, причем для каждого уровня (способа получения) было сделано по пять наблюдений.

Получены следующие данные:

Способы получения катализатора Активность катализатора
А1 56; 55; 62; 59; 60;
А2 64; 61; 50; 55; 56;
А3 45; 46; 45; 39; 43;
А4 42; 39; 45; 43; 41;

 

Необходимо проверить независимость качества (активности) катализатора от способа получения.

Решение. По имеющимся данным yij определим средние значения активности катализатора при каждом (из четырех) i-ом способе его получения.

Находим = 58.4; = 57.2; = 43.6; = 42.0.

Среднее значение переменной Y по всем наблюдениям = 50.3.

Результаты других расчетов сведены в табл. 4.2.

Таблица 4.

Результатырасчета примера однофакторного дисперсионного анализа

Источник изменчивости Сумма квадратов отклонений Число степеней свободы Дисперсия FH
Факторная (систематическая) 378.3 29.8
Случайная составляющая 203.2 12.7  
Общая изменчивость 1338.2    

 

Критическое значение критерия находим по таблицам квантилей F -распределения при уровне значимости = 0.05, что соответствует квантилю порядка 0.95:

Fkp =F(0.95;2; 27) = 3.35.

Так как FH > Fkp , то гипотеза Н0 - об одинаковой активности катализатора при различных способах его получения (на каждом уровне) отвергается, и принимается конкурирующая гипотеза Н1 - активность ката­лизатора при различных способах его получения различна.