рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

ОДНОФАКТОРНЫЙ ANOVA

ОДНОФАКТОРНЫЙ ANOVA - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Однофакторный (One-Way) Anova Позволяет Проверить Гипотезу О Том, Что Изучаем...

Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (сред­ние значения, соответствующие разным градациям фактора, различаются).


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгруп­повая (факторная) составляющая изменчивости обусловлена различием сред­них значений под влиянием фактора. Внутригрупповая (случайная) составля­ющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (раз­личия средних значений групп, соответствующих уровням фактора).

Нулевая статистическая гипотеза содержит утверждение о равенстве сред­них значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.

Исходные предположения: распределение зависимой переменной в сравни­ваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимы­ми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из нескольких сравни­ваемых выборок.

ПРИМЕР______________________________________________________________

Исследовалось влияние на продуктивность воспроизведения (Y) вербального ма­териала интервала между 5 повторениями г3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).

Структура данных:

 

Хх (интервал) У (эффективность воспроизведения)
I
     
N

Ограничения: если дисперсии выборок различаются статистически досто­верно, то метод неприменим. Для проверки однородности дисперсии приме­няется критерий Ливена (Levene's Test of Homogeneity of Variances). Формаль­но численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).

Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.

Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

фактора. Основной показатель для принятия решения — ^-уровень значимо­сти критерия /-Фишера.

Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние зна­чения для разных градаций фактора.

Рассмотрим общие принципы и последовательность вычислений для од-нофакторного ANOVA в случае равной численности сравниваемых выборок.

Исходная идея ANOVA заключается в возможности разложения показателя изменчивости признака на две составляющие: изменчивость внутри групп и изменчивость между группами. В качестве показателя изменчивости исполь­зуется сумма квадратов отклонения значений признака от среднего, которая обозначается SS (Sum of Squares).

Общая (Total) сумма квадратов (SStolai) является показателем общей измен­чивости зависимой переменной и представляет собой числитель дисперсии:

/=]

Соответственно, общая сумма квадратов равна сумме межгрупповой и внут ригрупповой сумм квадратов:

Межгрупповая (Between-Group) сумма квадратов (SSbg) — показатель измен чивости между к группами (каждая численностью п объектов):

где Mj — среднее значение для группы/

Отношение межгрупповой и общей суммы квадратов показывает долю об­щей дисперсии зависимой переменной, обусловленную влиянием фактора. Этот показатель идентичен по смыслу квадрату коэффициента корреляции в ре­грессионном анализе, поэтому тоже называется коэффициентом детермина­ции (R1):

°°total

Коэффициент детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на диспер­сию зависимой переменной. Помноженный на 100, он выражает процент уч­тенной дисперсии.

Внутригрупповая (Within-Group) сумма квадратов (SSwg) — показатель слу­чайной изменчивости (внутри групп):

ее _ ее _ ее _


На величину сумм квадратов влияет численность и количество сравнивае­мых групп. Поэтому для сопоставления межгрупповой и внутригрупповой изменчивости используются средние квадраты (обозначается MS — от анг­лийского Mean of Squares). Средний квадрат — это частное от деления суммы квадратов на соответствующее число степеней свободы.

Каждая сумма квадратов характеризуется своим числом степеней свободы (df). Так, общее число степеней свободы соответствует общей сумме квадратов и равно:

Заметим, что частное от деления общей суммы квадратов на общее число степеней свободы — общий средний квадрат — это общая дисперсия.

Число степеней свободы для межгрупповой суммы квадратов равно числу сла­гаемых минус один (число групп минус 1):



 


Следует отметить, что тот и другой средние квадраты представляют собой различные выборочные оценки одной и той же генеральной дисперсии — для случая, когда сравниваемые средние не различаются. Однако это не так в слу­чае, если хотя бы два из всех сравниваемых средних различаются: тогда меж­групповой средний квадрат превысит внутригрупповой средний квадрат. И чем больше величина отношения межгруппового к внутригрупповому среднему квадрату, тем больше оснований считать, что сравниваемые средние значе­ния различаются. Соответственно, основным показателем ANOVA является F-отношение — эмпирическое значение критерия F-Фишера:

Процедура проверки Но подразумевает направленную альтернативу, так как ее отклонению соответствует только большее значение F3 (MSbg > MSwg). По­этому для определения р-уровня значимости при вычислениях «вручную» при­меняются таблицы критических значений /'-распределения для направлен­ных альтернатив (односторонний критерий). Для одних и тех же ^уровень значимости возрастает (/ьуровень убывает) при возрастании Гэ.


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

Последовательность выполнения AN OVA является общей для любого числа факторов. Вначале в общей изменчивости зависи­мой переменной выделяются основные ее составляющие. (В од-нофакторном АТЧОУАихдве: внутри групповая (случайная) и меж­групповая (факторная) изменчивость.) После этого вычисляются соответствующие показатели в следующей последовательности:

П суммы квадратов {SS)

□ числа степеней свободы (df); '

D средние квадраты (MS);

О /^-отношения;

П ^-уровни значимости.

% ■-

..... i

ПРИМЕР 13.1


Предположим, изучалось различие в продуктивности воспроизведения од­ного и того же материала трех групп испытуемых (по 5 человек), различа­ющихся условиями предъявления это­го материала для запоминания. Зави­симая переменная (У) — количество воспроизведенных единиц материала, независимая переменная (фактор) — условия предъявления (три градации). Проверим на уровне а = 0,01 гипотезу о том, что продуктивность воспроиз­ведения материала зависит от условий его предъявления.


Условие 121

– Конец работы –

Эта тема принадлежит разделу:

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ОДНОФАКТОРНЫЙ ANOVA

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ
Обычно исследование проводится для проверки гипотезы, которая явля­ется следствием теоретических представлений.1 Эта гипотеза содержит утвер­ждение о связи абстрактных категорий, относящ

ИДЕЯ ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ
Рассмотрим идею проверки статистической гипотезы на примере. Пред­положим, психолог решил проверить пригодность разработанных ранее норм для имеющегося в его распоряжении теста интеллекта. Прежний

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статис

СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ
До сих пор под проверкой статистической гипотезы мы подразумевали про­цедуру определения надежности связи (р-уровня, как показателя статистичес­кой значимости). Однако в конечном итоге проверка ста

ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА
Приступая к операционализации содержательной гипотезы — к определе­нию того, как будут измерены изучаемые явления, исследователь уже должен представлять себе, какому методу статистического выв

Анализ таблиц сопряженности
Условие применения: для. каждого объекта (испытуемого) выборки опреде­лена его принадлежность к одной из категорий (градаций) Хи к одной из ка­тегорий (градаций) Y (получена пе

Общий случай: число градаций больше двух
ПРИМЕР Исследовались различия между мужчинами и женщинами в предпочтениях пяти политических лидеров.

Таблицы сопряженности 2x2 с независимыми выборками
ПРИМЕР Методом «потерянных писем» исследовалась склонность людей передавать хоро­шие и плохие новости. Из

Таблицы сопряженности 2x2 с повторными измерениями
ПРИМЕР Необходимо сравнить два вопроса, заданных одной и той же группе испытуемых, по соотношению ответов

Сравнение двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух независимых выборок. ПРИМЕР____________________________________

Сравнение 2-х зависимых выборок
Условия применения: (а) признак измерен у объектов (испытуемых), каж­дый из которых принадлежит к одной из двух зависимых выборок: либо при- ГЛАВА 8. ВЫБОР МЕТОДА СТАТИСТИЧЕ

Сравнение более двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из к независимых выборок (к > 2). ЧАСТЬ II. МЕТОДЫ СТАТИС

АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-види­мому, самого широкого класса гипотез — в отношении тех явлений, измере­ния которых доступны в номинативной шкале.

Две градации
Эта задача сводится к сравнению численности двух долей объектов (лю­дей, событий и т. д.) в совокупности: обладающих и не обладающих некото­рым свойством. ПРИМЕР________________________

Обработка на компьютере: биномиальный критерий
Исходные данные: значения бинарной номинативной переменной (0, 1) оп­ределены для каждого члена выборки и представлены одним столбцом. Выбираем: Analyze (Метод) > Nonparam

Binomial Test
      Category N Observed Prop. Test Prop. Exact Sig. (1-tailed)

Test Statistics
    Y Chi-Square{a) df Asymp. Sig. 13.333 4 .010 a 0 cells (.0%) have expected frequenc

Число градаций больше двух
По сравнению с анализом классификации, специфика применения крите­рия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдель

Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, ког­да одна группа объектов классифицируется по двум дихотомическим основа­ниям и проверяется гипотеза о связи этих двух оснований к

Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же осно­ванию. Рассмотрим проверку гипотезы в отношении таких да

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляционный анализ — это проверка гипотез о связях между переменны­ми с использованием коэффициентов корреляции. Наиболее распространен­ные коэффициенты корреляции подробно рассмотрены в

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметри­ческого критерия t-Стьюдента. Следует различать

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух ie-неральных совокупностей, из которых извлечены сравниваемые зависимые вы­борки, отличаются друг от друга. Допущение зави

Критерий r-Стьюдента для одной выборки.
A) Выбираем Analyze > Compare meansj> One Sample T-Test... Б) Воткрывшемся окне диалога выделяем и переносим интересующие пе­ременные из левого окна

Group Statistics
     

Paired Samples Statistics
    Mean N Std. Deviation Std. Error Mean Pair 1 VAR2 VAR3 11.9000 9.6000

Paired Samples Test
          Paired Differences      

ОБЩИЕ ЗАМЕЧАНИЯ
К методам сравнения выборок, в соответствии с принятой классификаци­ей1, мы относим способы проверки статистических гипотез о различии выбо­рок по уровню выраженности признака, измеренно

СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Самым популярным и наиболее чувствительным (мощным) аналогом кри­терия f-Стьюдента для независимых выборок является критерий U-Манна-Уитни (Mann-Whitney U). Непараметрическим его аналогом яв

Обработка на компьютере: критерий (7-Манна-Уитни
Для обработки использованы данные примера 12.1. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Самым чувствительным (мощным) аналогом критерия f-Стьюдента для зависимых выборок является критерий Т-Вилкоксона (Wilcoxon signed-rank test). Непараметрическим его аналогом является крите

Обработка на компьютере: критерий Г-Вилкоксона
Для обработки использованы данные примера 12.2. Исходные данные для обработки введены в таблицу (Data Editor)в виде двух переменных: varl — «Условие 1»; var2 — «Условие 2».

СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Критерий IIКраскала-Уоллеса (Kruskal- Wallis H) является непараметричес­ким аналогом однофакторного дисперсионного анализа (ANOVA) для неза­висимых выборок, поэтому другое его название —

Обработка на компьютере: критерий Я-Краскала-Уоллеса
Для обработки использованы данные примера 12.3. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Критерий %2-Фридмана (Friedman test) является непараметрическим анало­гом однофакторного дисперсионного анализа (ANOVA) для повторных изме­рений. Он позволяет проверять гипотезы о

Обработка на компьютере: критерий х2-Фридмана
Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor)в виде четырех переменных, соот­ветствующих четырем сравниваемым услови

Условие 122
Так зависит ли запоминание материала от условий его предъявления?   Условие 1 Условие 2 Условие 3 №

Обработка на компьютере
Рассмотрим применение однофакторного ANOVA к данным примера 13.1 Исходные данные для анализа введены в таблицу (Data Editor)в следую­щем виде:

Descriptives VOSPR
Первая колонка — номера градаций фактора, вторая колонка (N) — чис­ленность выборок, Mean — средние значе

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA
В состав процедур ANOVA включаются множественные сравнения сред­них значений для разных уровней фактора: парные сравнения средних после отклонения H0(Post Hoc Tests); метод контрастов (C

Обработка на компьютере
Рассмотрим применение методов множественного сравнения с использо­ванием данных примера 13.1. Применим метод Шеффе для парного сравне­ния средних и метод контрастов для сравнения третьего уровня фа

Scheffe
  Fl N Subset for alpha = .05     1.00

N[(Mm-M)2 +(MB2-M)2+(MB3-M)2].
 

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги