ОДНОФАКТОРНЫЙ ANOVA

Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (сред­ние значения, соответствующие разным градациям фактора, различаются).


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгруп­повая (факторная) составляющая изменчивости обусловлена различием сред­них значений под влиянием фактора. Внутригрупповая (случайная) составля­ющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (раз­личия средних значений групп, соответствующих уровням фактора).

Нулевая статистическая гипотеза содержит утверждение о равенстве сред­них значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.

Исходные предположения: распределение зависимой переменной в сравни­ваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимы­ми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из нескольких сравни­ваемых выборок.

ПРИМЕР______________________________________________________________

Исследовалось влияние на продуктивность воспроизведения (Y) вербального ма­териала интервала между 5 повторениями г3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).

Структура данных:

 

Хх (интервал) У (эффективность воспроизведения)
I
     
N

Ограничения: если дисперсии выборок различаются статистически досто­верно, то метод неприменим. Для проверки однородности дисперсии приме­няется критерий Ливена (Levene's Test of Homogeneity of Variances). Формаль­но численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).

Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.

Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

фактора. Основной показатель для принятия решения — ^-уровень значимо­сти критерия /-Фишера.

Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние зна­чения для разных градаций фактора.

Рассмотрим общие принципы и последовательность вычислений для од-нофакторного ANOVA в случае равной численности сравниваемых выборок.

Исходная идея ANOVA заключается в возможности разложения показателя изменчивости признака на две составляющие: изменчивость внутри групп и изменчивость между группами. В качестве показателя изменчивости исполь­зуется сумма квадратов отклонения значений признака от среднего, которая обозначается SS (Sum of Squares).

Общая (Total) сумма квадратов (SStolai) является показателем общей измен­чивости зависимой переменной и представляет собой числитель дисперсии:

/=]

Соответственно, общая сумма квадратов равна сумме межгрупповой и внут ригрупповой сумм квадратов:

Межгрупповая (Between-Group) сумма квадратов (SSbg) — показатель измен чивости между к группами (каждая численностью п объектов):

где Mj — среднее значение для группы/

Отношение межгрупповой и общей суммы квадратов показывает долю об­щей дисперсии зависимой переменной, обусловленную влиянием фактора. Этот показатель идентичен по смыслу квадрату коэффициента корреляции в ре­грессионном анализе, поэтому тоже называется коэффициентом детермина­ции (R1):

°°total

Коэффициент детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на диспер­сию зависимой переменной. Помноженный на 100, он выражает процент уч­тенной дисперсии.

Внутригрупповая (Within-Group) сумма квадратов (SSwg) — показатель слу­чайной изменчивости (внутри групп):

ее _ ее _ ее _


На величину сумм квадратов влияет численность и количество сравнивае­мых групп. Поэтому для сопоставления межгрупповой и внутригрупповой изменчивости используются средние квадраты (обозначается MS — от анг­лийского Mean of Squares). Средний квадрат — это частное от деления суммы квадратов на соответствующее число степеней свободы.

Каждая сумма квадратов характеризуется своим числом степеней свободы (df). Так, общее число степеней свободы соответствует общей сумме квадратов и равно:

Заметим, что частное от деления общей суммы квадратов на общее число степеней свободы — общий средний квадрат — это общая дисперсия.

Число степеней свободы для межгрупповой суммы квадратов равно числу сла­гаемых минус один (число групп минус 1):



 


Следует отметить, что тот и другой средние квадраты представляют собой различные выборочные оценки одной и той же генеральной дисперсии — для случая, когда сравниваемые средние не различаются. Однако это не так в слу­чае, если хотя бы два из всех сравниваемых средних различаются: тогда меж­групповой средний квадрат превысит внутригрупповой средний квадрат. И чем больше величина отношения межгруппового к внутригрупповому среднему квадрату, тем больше оснований считать, что сравниваемые средние значе­ния различаются. Соответственно, основным показателем ANOVA является F-отношение — эмпирическое значение критерия F-Фишера:

Процедура проверки Но подразумевает направленную альтернативу, так как ее отклонению соответствует только большее значение F3 (MSbg > MSwg). По­этому для определения р-уровня значимости при вычислениях «вручную» при­меняются таблицы критических значений /'-распределения для направлен­ных альтернатив (односторонний критерий). Для одних и тех же ^уровень значимости возрастает (/ьуровень убывает) при возрастании Гэ.


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

Последовательность выполнения AN OVA является общей для любого числа факторов. Вначале в общей изменчивости зависи­мой переменной выделяются основные ее составляющие. (В од-нофакторном АТЧОУАихдве: внутри групповая (случайная) и меж­групповая (факторная) изменчивость.) После этого вычисляются соответствующие показатели в следующей последовательности:

П суммы квадратов {SS)

□ числа степеней свободы (df); '

D средние квадраты (MS);

О /^-отношения;

П ^-уровни значимости.

% ■-

..... i

ПРИМЕР 13.1


Предположим, изучалось различие в продуктивности воспроизведения од­ного и того же материала трех групп испытуемых (по 5 человек), различа­ющихся условиями предъявления это­го материала для запоминания. Зави­симая переменная (У) — количество воспроизведенных единиц материала, независимая переменная (фактор) — условия предъявления (три градации). Проверим на уровне а = 0,01 гипотезу о том, что продуктивность воспроиз­ведения материала зависит от условий его предъявления.


Условие 121