рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Статистическая Значимость(Significant Level, Сокращен...

Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статистической ги­потезы. Говоря техническим языком, это вероятность получения данного ре­зультата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статис-


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

тическая значимость, р-уровень значимости является количественной оцен­кой надежности связи: чем меньше эта вероятность, тем надежнее связь.

Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности по­казала, что если она верна, то вероятность случайного появления обнаружен­ных различий составляет не более 5%. Иначе говоря, если бы две выборки мно­гократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средни­ми этих выборок. То есть существует 5%-ная вероятность того, что обнаружен­ные различия носят случайный характер, а не являются свойством совокупности.

В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой ги­потезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:

□ величина связи (различия) больше;

□ изменчивость признака (признаков) меньше;

□ объем выборки (выборок) больше.

Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназна­ченные для соотнесения эмпирических значений статистик с теоретически­ми распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при уве­личении объема выборки.

Чем больше гипотез проверяется, тем выше шанс получить результат чис­то случайно — р-уровень увеличивается пропорционально количеству проверяе­мых гипотез!

Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентич­ной) выборке.

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

упомянули критерий ^-Стьюдента. Как следует из логики проверки статисти­ческих гипотез, в качестве основы для применения статистических критери­ев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим рас­пределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследо­ватель вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.

Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы(degrees of free­dom — обозначается как df)— это количество возможных направлений измен­чивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти пока­затели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следу­ющее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.

Назначение критерия— проверка статистической гипотезы путем опреде­ления/ьуровня значимости (вероятности того, что Но верна).

Выбор критерияопределяется проверяемой статистической гипотезой.

Критерий включает в себя:

Пформулу расчета эмпирического значения критерия по выборочным ста­тистикам; D правило (формулу) определения числа степеней свободы;

□ теоретическое распределение для данного числа степеней свободы;

□ правило соотнесения эмпирического значения критерия с теоретичес­
ким распределением для определения вероятности того, что Но верна.

Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать раз­ные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообра­зия: вычисленное по формуле эмпирическое значение критерия сопоставля­ется с теоретическим распределением для заданного числа степеней свобо­ды, что позволяет определить вероятность того, что Но верна.

ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА


V

Выбор критерия представляет собой отдельную проблему

будет рассматриваться нами в следующей главе. А сейчас будем исходить из того, что исследователь уже решил проблему выбора критерия, и рассмотрим общую последовательность проверки гипотезы.

При обработке данных на компьютере при помощи статистической про­граммы (например, SPSS) исследователю достаточно указать программе, ка­кой критерий (метод, тест) необходимо применить к заданной выборке ис­ходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве ре­зультата исследователь получает значение ^-уровня значимости, наряду с эм­пирическим значением критерия и числом степеней свободы.

Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:

1. Выбор критерия в зависимости от вида исходных данных и статистичес­
кой гипотезы: теоретического распределения, формул расчета эмпири­
ческого значения критерия и числа степеней свободы.

2. Расчет по исходным данным (или по имеющимся статистикам) эмпи­
рического значения критерия и числа степеней свободы.

3. Применение «Таблицы критических значений критерия» позволяет оп­
ределить значение /?-уровня для данного числа степеней свободы.

Таблица критических значенийсодержит значения (квантили) теоретичес­кого распределения, соответствующие наиболее важным — критическим зна­чениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. /7-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и/?-уровни, им соответствующие. Далее значение р-уровня опреде­ляется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием /ьуровня):

П если эмпирическое значение критерия э) находится между двумя кри­тическими значениями, то /^-уровень меньше того критического р, ко­торое находится левее;


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;

О если Кэ находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.

Например, если эмпирическое значение критерия (Кэ) находится между А^05 и А'оо,, то р < 0,05. Если Кэ находится левее ЛГО>Ь то р > 0,1. Если А^ находится правее АоОП,, тор < 0,001.

Решение исследователя:

р>0,1 р<0,1 р<0,05 р < 0,01 р< 0,001

Рис. 7.2. Схема определения/^-уровня (р~ ... — критические значения/ьуровня, К — соответствующие критические значения критерия)

Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, у} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше/^-уровень). Но для некоторых критериев зависимость обратная. На­пример, £/-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения ^-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если t3 находится между /0, и г005 (т. е. /0,i < t3< tQ$5), тор < 0,1. И если 1/э находится между UQl и £/о,о5 (т.е- ^о,о5 < &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/э < tQ но С/э > Uo^), то уровень значимости определяется как/j > 0,1.

ПРИМЕРЫ_____________________________________________________________

1. Гипотеза Но: М -100 проверяется при помощи критерия /-Стьюдента. Для вы­
числения эмпирического значения критерия t3 применяется формула 7.2. На
выборке vV= 36 получены следующие значения статистик: М= 107,5, о = 15. По
формуле 7.2 t3- 3, df= 35. Далее воспользуемся таблицей критических значений
/-Стьюдента (приложение 2). В этой таблице строки соответствуют df— числам
степеней свободы, столбцы — критическим значениям р-уровня. В строке для
df— 35 обнаруживаем, что наше эмпирическое значение попадает в интервал
между значениями 2,724 (для р - 0,01) и 3,591 (для р ~ 0,001). Следовательно,
вероятность того, что Но верна, р < 0,01.

2. Предположим, та же гипотеза проверяется на выборке N — 36, но получены сле­
дующие значения статистик: М= 102,5, а— 15. По формуле 1Э=, df= 35. Вос­
пользовавшись той же таблицей критических значений, обнаруживаем, что
наше эмпирическое значение меньше, чем /Oil = 1,69. Следовательно, в соответ­
ствии со схемой на рис. 7.2, р > 0,1.


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

– Конец работы –

Эта тема принадлежит разделу:

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ
Обычно исследование проводится для проверки гипотезы, которая явля­ется следствием теоретических представлений.1 Эта гипотеза содержит утвер­ждение о связи абстрактных категорий, относящ

ИДЕЯ ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ
Рассмотрим идею проверки статистической гипотезы на примере. Пред­положим, психолог решил проверить пригодность разработанных ранее норм для имеющегося в его распоряжении теста интеллекта. Прежний

СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ
До сих пор под проверкой статистической гипотезы мы подразумевали про­цедуру определения надежности связи (р-уровня, как показателя статистичес­кой значимости). Однако в конечном итоге проверка ста

ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА
Приступая к операционализации содержательной гипотезы — к определе­нию того, как будут измерены изучаемые явления, исследователь уже должен представлять себе, какому методу статистического выв

Анализ таблиц сопряженности
Условие применения: для. каждого объекта (испытуемого) выборки опреде­лена его принадлежность к одной из категорий (градаций) Хи к одной из ка­тегорий (градаций) Y (получена пе

Общий случай: число градаций больше двух
ПРИМЕР Исследовались различия между мужчинами и женщинами в предпочтениях пяти политических лидеров.

Таблицы сопряженности 2x2 с независимыми выборками
ПРИМЕР Методом «потерянных писем» исследовалась склонность людей передавать хоро­шие и плохие новости. Из

Таблицы сопряженности 2x2 с повторными измерениями
ПРИМЕР Необходимо сравнить два вопроса, заданных одной и той же группе испытуемых, по соотношению ответов

Сравнение двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух независимых выборок. ПРИМЕР____________________________________

Сравнение 2-х зависимых выборок
Условия применения: (а) признак измерен у объектов (испытуемых), каж­дый из которых принадлежит к одной из двух зависимых выборок: либо при- ГЛАВА 8. ВЫБОР МЕТОДА СТАТИСТИЧЕ

Сравнение более двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из к независимых выборок (к > 2). ЧАСТЬ II. МЕТОДЫ СТАТИС

АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-види­мому, самого широкого класса гипотез — в отношении тех явлений, измере­ния которых доступны в номинативной шкале.

Две градации
Эта задача сводится к сравнению численности двух долей объектов (лю­дей, событий и т. д.) в совокупности: обладающих и не обладающих некото­рым свойством. ПРИМЕР________________________

Обработка на компьютере: биномиальный критерий
Исходные данные: значения бинарной номинативной переменной (0, 1) оп­ределены для каждого члена выборки и представлены одним столбцом. Выбираем: Analyze (Метод) > Nonparam

Binomial Test
      Category N Observed Prop. Test Prop. Exact Sig. (1-tailed)

Test Statistics
    Y Chi-Square{a) df Asymp. Sig. 13.333 4 .010 a 0 cells (.0%) have expected frequenc

Число градаций больше двух
По сравнению с анализом классификации, специфика применения крите­рия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдель

Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, ког­да одна группа объектов классифицируется по двум дихотомическим основа­ниям и проверяется гипотеза о связи этих двух оснований к

Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же осно­ванию. Рассмотрим проверку гипотезы в отношении таких да

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляционный анализ — это проверка гипотез о связях между переменны­ми с использованием коэффициентов корреляции. Наиболее распространен­ные коэффициенты корреляции подробно рассмотрены в

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметри­ческого критерия t-Стьюдента. Следует различать

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух ie-неральных совокупностей, из которых извлечены сравниваемые зависимые вы­борки, отличаются друг от друга. Допущение зави

Критерий r-Стьюдента для одной выборки.
A) Выбираем Analyze > Compare meansj> One Sample T-Test... Б) Воткрывшемся окне диалога выделяем и переносим интересующие пе­ременные из левого окна

Group Statistics
     

Paired Samples Statistics
    Mean N Std. Deviation Std. Error Mean Pair 1 VAR2 VAR3 11.9000 9.6000

Paired Samples Test
          Paired Differences      

ОБЩИЕ ЗАМЕЧАНИЯ
К методам сравнения выборок, в соответствии с принятой классификаци­ей1, мы относим способы проверки статистических гипотез о различии выбо­рок по уровню выраженности признака, измеренно

СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Самым популярным и наиболее чувствительным (мощным) аналогом кри­терия f-Стьюдента для независимых выборок является критерий U-Манна-Уитни (Mann-Whitney U). Непараметрическим его аналогом яв

Обработка на компьютере: критерий (7-Манна-Уитни
Для обработки использованы данные примера 12.1. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Самым чувствительным (мощным) аналогом критерия f-Стьюдента для зависимых выборок является критерий Т-Вилкоксона (Wilcoxon signed-rank test). Непараметрическим его аналогом является крите

Обработка на компьютере: критерий Г-Вилкоксона
Для обработки использованы данные примера 12.2. Исходные данные для обработки введены в таблицу (Data Editor)в виде двух переменных: varl — «Условие 1»; var2 — «Условие 2».

СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Критерий IIКраскала-Уоллеса (Kruskal- Wallis H) является непараметричес­ким аналогом однофакторного дисперсионного анализа (ANOVA) для неза­висимых выборок, поэтому другое его название —

Обработка на компьютере: критерий Я-Краскала-Уоллеса
Для обработки использованы данные примера 12.3. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Критерий %2-Фридмана (Friedman test) является непараметрическим анало­гом однофакторного дисперсионного анализа (ANOVA) для повторных изме­рений. Он позволяет проверять гипотезы о

Обработка на компьютере: критерий х2-Фридмана
Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor)в виде четырех переменных, соот­ветствующих четырем сравниваемым услови

ОДНОФАКТОРНЫЙ ANOVA
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (сред­ние значения, соответствующие разным градациям фактора, различ

Условие 122
Так зависит ли запоминание материала от условий его предъявления?   Условие 1 Условие 2 Условие 3 №

Обработка на компьютере
Рассмотрим применение однофакторного ANOVA к данным примера 13.1 Исходные данные для анализа введены в таблицу (Data Editor)в следую­щем виде:

Descriptives VOSPR
Первая колонка — номера градаций фактора, вторая колонка (N) — чис­ленность выборок, Mean — средние значе

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA
В состав процедур ANOVA включаются множественные сравнения сред­них значений для разных уровней фактора: парные сравнения средних после отклонения H0(Post Hoc Tests); метод контрастов (C

Обработка на компьютере
Рассмотрим применение методов множественного сравнения с использо­ванием данных примера 13.1. Применим метод Шеффе для парного сравне­ния средних и метод контрастов для сравнения третьего уровня фа

Scheffe
  Fl N Subset for alpha = .05     1.00

N[(Mm-M)2 +(MB2-M)2+(MB3-M)2].
 

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги