Реферат Курсовая Конспект
ОДНОФАКТОРНЫЙ ANOVA - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Однофакторный (One-Way) Anova Позволяет Проверить Гипотезу О Том, Что Изучаем...
|
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (средние значения, соответствующие разным градациям фактора, различаются).
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгрупповая (факторная) составляющая изменчивости обусловлена различием средних значений под влиянием фактора. Внутригрупповая (случайная) составляющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (различия средних значений групп, соответствующих уровням фактора).
Нулевая статистическая гипотеза содержит утверждение о равенстве средних значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.
Исходные предположения: распределение зависимой переменной в сравниваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимыми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.
Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из нескольких сравниваемых выборок.
ПРИМЕР______________________________________________________________
Исследовалось влияние на продуктивность воспроизведения (Y) вербального материала интервала между 5 повторениями (Хг — 3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).
Структура данных:
№ | Хх (интервал) | У (эффективность воспроизведения) |
I | ||
N |
Ограничения: если дисперсии выборок различаются статистически достоверно, то метод неприменим. Для проверки однородности дисперсии применяется критерий Ливена (Levene's Test of Homogeneity of Variances). Формально численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).
Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.
Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
фактора. Основной показатель для принятия решения — ^-уровень значимости критерия /-Фишера.
Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние значения для разных градаций фактора.
Рассмотрим общие принципы и последовательность вычислений для од-нофакторного ANOVA в случае равной численности сравниваемых выборок.
Исходная идея ANOVA заключается в возможности разложения показателя изменчивости признака на две составляющие: изменчивость внутри групп и изменчивость между группами. В качестве показателя изменчивости используется сумма квадратов отклонения значений признака от среднего, которая обозначается SS (Sum of Squares).
Общая (Total) сумма квадратов (SStolai) является показателем общей изменчивости зависимой переменной и представляет собой числитель дисперсии:
/=]
Соответственно, общая сумма квадратов равна сумме межгрупповой и внут ригрупповой сумм квадратов:
Межгрупповая (Between-Group) сумма квадратов (SSbg) — показатель измен чивости между к группами (каждая численностью п объектов):
где Mj — среднее значение для группы/
Отношение межгрупповой и общей суммы квадратов показывает долю общей дисперсии зависимой переменной, обусловленную влиянием фактора. Этот показатель идентичен по смыслу квадрату коэффициента корреляции в регрессионном анализе, поэтому тоже называется коэффициентом детерминации (R1):
°°total
Коэффициент детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на дисперсию зависимой переменной. Помноженный на 100, он выражает процент учтенной дисперсии.
Внутригрупповая (Within-Group) сумма квадратов (SSwg) — показатель случайной изменчивости (внутри групп):
ее _ ее _ ее _
На величину сумм квадратов влияет численность и количество сравниваемых групп. Поэтому для сопоставления межгрупповой и внутригрупповой изменчивости используются средние квадраты (обозначается MS — от английского Mean of Squares). Средний квадрат — это частное от деления суммы квадратов на соответствующее число степеней свободы.
Каждая сумма квадратов характеризуется своим числом степеней свободы (df). Так, общее число степеней свободы соответствует общей сумме квадратов и равно:
Заметим, что частное от деления общей суммы квадратов на общее число степеней свободы — общий средний квадрат — это общая дисперсия.
Число степеней свободы для межгрупповой суммы квадратов равно числу слагаемых минус один (число групп минус 1):
Следует отметить, что тот и другой средние квадраты представляют собой различные выборочные оценки одной и той же генеральной дисперсии — для случая, когда сравниваемые средние не различаются. Однако это не так в случае, если хотя бы два из всех сравниваемых средних различаются: тогда межгрупповой средний квадрат превысит внутригрупповой средний квадрат. И чем больше величина отношения межгруппового к внутригрупповому среднему квадрату, тем больше оснований считать, что сравниваемые средние значения различаются. Соответственно, основным показателем ANOVA является F-отношение — эмпирическое значение критерия F-Фишера:
Процедура проверки Но подразумевает направленную альтернативу, так как ее отклонению соответствует только большее значение F3 (MSbg > MSwg). Поэтому для определения р-уровня значимости при вычислениях «вручную» применяются таблицы критических значений /'-распределения для направленных альтернатив (односторонний критерий). Для одних и тех же ^уровень значимости возрастает (/ьуровень убывает) при возрастании Гэ.
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
Последовательность выполнения AN OVA является общей для любого числа факторов. Вначале в общей изменчивости зависимой переменной выделяются основные ее составляющие. (В од-нофакторном АТЧОУАихдве: внутри групповая (случайная) и межгрупповая (факторная) изменчивость.) После этого вычисляются соответствующие показатели в следующей последовательности:
П суммы квадратов {SS)
□ числа степеней свободы (df); '
D средние квадраты (MS);
О /^-отношения;
П ^-уровни значимости.
% ■-
..... i
ПРИМЕР 13.1
Предположим, изучалось различие в продуктивности воспроизведения одного и того же материала трех групп испытуемых (по 5 человек), различающихся условиями предъявления этого материала для запоминания. Зависимая переменная (У) — количество воспроизведенных единиц материала, независимая переменная (фактор) — условия предъявления (три градации). Проверим на уровне а = 0,01 гипотезу о том, что продуктивность воспроизведения материала зависит от условий его предъявления.
Условие 121 |
– Конец работы –
Эта тема принадлежит разделу:
ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ОДНОФАКТОРНЫЙ ANOVA
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов