рефераты конспекты курсовые дипломные лекции шпоры

Раздел Социология
/
УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ

Реферат Курсовая Конспект

Выберите учебное заведение

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Статистическая Значимость(Significant Level, Сокращен...

Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статистической гипотезы. Говоря техническим языком, это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статис-

ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

тическая значимость, р-уровень значимости является количественной оценкой надежности связи: чем меньше эта вероятность, тем надежнее связь.

Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности показала, что если она верна, то вероятность случайного появления обнаруженных различий составляет не более 5%. Иначе говоря, если бы две выборки многократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средними этих выборок. То есть существует 5%-ная вероятность того, что обнаруженные различия носят случайный характер, а не являются свойством совокупности.

В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой гипотезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:

□ величина связи (различия) больше;

□ изменчивость признака (признаков) меньше;

□ объем выборки (выборок) больше.

Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназначенные для соотнесения эмпирических значений статистик с теоретическими распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при увеличении объема выборки.

Чем больше гипотез проверяется, тем выше шанс получить результат чисто случайно — р-уровень увеличивается пропорционально количеству проверяемых гипотез!

Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентичной) выборке.

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также

ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

упомянули критерий ^-Стьюдента. Как следует из логики проверки статистических гипотез, в качестве основы для применения статистических критериев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим распределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследователь вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.

Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы(degrees of freedom — обозначается как df)— это количество возможных направлений изменчивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти показатели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следующее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.

Назначение критерия— проверка статистической гипотезы путем определения/ьуровня значимости (вероятности того, что Н_о верна).

Выбор критерияопределяется проверяемой статистической гипотезой.

Критерий включает в себя:

Пформулу расчета эмпирического значения критерия по выборочным статистикам; D правило (формулу) определения числа степеней свободы;

□ теоретическое распределение для данного числа степеней свободы;

□ правило соотнесения эмпирического значения критерия с теоретичес
ким распределением для определения вероятности того, что Н_о верна.

Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать разные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообразия: вычисленное по формуле эмпирическое значение критерия сопоставляется с теоретическим распределением для заданного числа степеней свободы, что позволяет определить вероятность того, что Н_о верна.

ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая

ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

Выбор критерия представляет собой отдельную проблему

будет рассматриваться нами в следующей главе. А сейчас будем исходить из того, что исследователь уже решил проблему выбора критерия, и рассмотрим общую последовательность проверки гипотезы.

При обработке данных на компьютере при помощи статистической программы (например, SPSS) исследователю достаточно указать программе, какой критерий (метод, тест) необходимо применить к заданной выборке исходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве результата исследователь получает значение ^-уровня значимости, наряду с эмпирическим значением критерия и числом степеней свободы.

Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:

1. Выбор критерия в зависимости от вида исходных данных и статистичес
кой гипотезы: теоретического распределения, формул расчета эмпири
ческого значения критерия и числа степеней свободы.

2. Расчет по исходным данным (или по имеющимся статистикам) эмпи
рического значения критерия и числа степеней свободы.

3. Применение «Таблицы критических значений критерия» позволяет оп
ределить значение /?-уровня для данного числа степеней свободы.

Таблица критических значенийсодержит значения (квантили) теоретического распределения, соответствующие наиболее важным — критическим значениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. /7-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и/?-уровни, им соответствующие. Далее значение р-уровня определяется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием /ьуровня):

П если эмпирическое значение критерия (К_э) находится между двумя критическими значениями, то /^-уровень меньше того критического р, которое находится левее;

ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;

О если К_э находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.

Например, если эмпирическое значение критерия (К_э) находится между А^₀₅и А'оо,, то р < 0,05. Если К_э находится левее ЛГ_О>Ь то р > 0,1. Если А^ находится правее Ао_ОП,, тор < 0,001.

Решение исследователя:

р>0,1 р<0,1 р<0,05 р < 0,01 р< 0,001

Рис. 7.2. Схема определения/^-уровня (р~ ... — критические значения/ьуровня, К — соответствующие критические значения критерия)

Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, у} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше/^-уровень). Но для некоторых критериев зависимость обратная. Например, £/-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения ^-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если t₃ находится между /₀, и г₀₀₅ (т. е. /₀,i < t₃< t_Q$₅), тор < 0,1. И если 1/_э находится между U_Ql и £/о,о5 (т.^е- ^о,о5 ^< &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/_э < t_Q_>ь но С/_э > U_o^), то уровень значимости определяется как/j > 0,1.

ПРИМЕРЫ_____________________________________________________________

1. Гипотеза Н_о: М -100 проверяется при помощи критерия /-Стьюдента. Для вы
числения эмпирического значения критерия t₃ применяется формула 7.2. На
выборке vV= 36 получены следующие значения статистик: М= 107,5, о = 15. По
формуле 7.2 t₃- 3, df= 35. Далее воспользуемся таблицей критических значений
/-Стьюдента (приложение 2). В этой таблице строки соответствуют df— числам
степеней свободы, столбцы — критическим значениям р-уровня. В строке для
df— 35 обнаруживаем, что наше эмпирическое значение попадает в интервал
между значениями 2,724 (для р - 0,01) и 3,591 (для р ~ 0,001). Следовательно,
вероятность того, что Н_о верна, р < 0,01.

2. Предположим, та же гипотеза проверяется на выборке N — 36, но получены сле
дующие значения статистик: М= 102,5, а— 15. По формуле 1_Э=, df= 35. Вос
пользовавшись той же таблицей критических значений, обнаруживаем, что
наше эмпирическое значение меньше, чем /_Oil = 1,69. Следовательно, в соответ
ствии со схемой на рис. 7.2, р > 0,1.

ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ
Обычно исследование проводится для проверки гипотезы, которая является следствием теоретических представлений.1 Эта гипотеза содержит утверждение о связи абстрактных категорий, относящ

ИДЕЯ ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ
Рассмотрим идею проверки статистической гипотезы на примере. Предположим, психолог решил проверить пригодность разработанных ранее норм для имеющегося в его распоряжении теста интеллекта. Прежний

СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка ста

ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА
Приступая к операционализации содержательной гипотезы — к определению того, как будут измерены изучаемые явления, исследователь уже должен представлять себе, какому методу статистического выв

Анализ таблиц сопряженности
Условие применения: для. каждого объекта (испытуемого) выборки определена его принадлежность к одной из категорий (градаций) Хи к одной из категорий (градаций) Y (получена пе

Общий случай: число градаций больше двух
ПРИМЕР Исследовались различия между мужчинами и женщинами в предпочтениях пяти политических лидеров.

Таблицы сопряженности 2x2 с независимыми выборками
ПРИМЕР Методом «потерянных писем» исследовалась склонность людей передавать хорошие и плохие новости. Из

Таблицы сопряженности 2x2 с повторными измерениями
ПРИМЕР Необходимо сравнить два вопроса, заданных одной и той же группе испытуемых, по соотношению ответов

Сравнение двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух независимых выборок. ПРИМЕР____________________________________

Сравнение 2-х зависимых выборок
Условия применения: (а) признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух зависимых выборок: либо при- ГЛАВА 8. ВЫБОР МЕТОДА СТАТИСТИЧЕ

Сравнение более двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из к независимых выборок (к > 2). ЧАСТЬ II. МЕТОДЫ СТАТИС

АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-видимому, самого широкого класса гипотез — в отношении тех явлений, измерения которых доступны в номинативной шкале.

Две градации
Эта задача сводится к сравнению численности двух долей объектов (людей, событий и т. д.) в совокупности: обладающих и не обладающих некоторым свойством. ПРИМЕР________________________

Обработка на компьютере: биномиальный критерий
Исходные данные: значения бинарной номинативной переменной (0, 1) определены для каждого члена выборки и представлены одним столбцом. Выбираем: Analyze (Метод) > Nonparam

Binomial Test
Category N Observed Prop. Test Prop. Exact Sig. (1-tailed)

Test Statistics
Y Chi-Square{a) df Asymp. Sig. 13.333 4 .010 a 0 cells (.0%) have expected frequenc

Число градаций больше двух
По сравнению с анализом классификации, специфика применения критерия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдель

Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, когда одна группа объектов классифицируется по двум дихотомическим основаниям и проверяется гипотеза о связи этих двух оснований к

Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же основанию. Рассмотрим проверку гипотезы в отношении таких да

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляционный анализ — это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Наиболее распространенные коэффициенты корреляции подробно рассмотрены в

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметрического критерия t-Стьюдента. Следует различать

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух ie-неральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Допущение зави

Критерий r-Стьюдента для одной выборки.
A) Выбираем Analyze > Compare meansj> One Sample T-Test... Б) Воткрывшемся окне диалога выделяем и переносим интересующие переменные из левого окна

Group Statistics

Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean Pair 1 VAR2 VAR3 11.9000 9.6000

Paired Samples Test
Paired Differences

ОБЩИЕ ЗАМЕЧАНИЯ
К методам сравнения выборок, в соответствии с принятой классификацией1, мы относим способы проверки статистических гипотез о различии выборок по уровню выраженности признака, измеренно

СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Самым популярным и наиболее чувствительным (мощным) аналогом критерия f-Стьюдента для независимых выборок является критерий U-Манна-Уитни (Mann-Whitney U). Непараметрическим его аналогом яв

Обработка на компьютере: критерий (7-Манна-Уитни
Для обработки использованы данные примера 12.1. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Самым чувствительным (мощным) аналогом критерия f-Стьюдента для зависимых выборок является критерий Т-Вилкоксона (Wilcoxon signed-rank test). Непараметрическим его аналогом является крите

Обработка на компьютере: критерий Г-Вилкоксона
Для обработки использованы данные примера 12.2. Исходные данные для обработки введены в таблицу (Data Editor)в виде двух переменных: varl — «Условие 1»; var2 — «Условие 2».

СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Критерий IIКраскала-Уоллеса (Kruskal- Wallis H) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для независимых выборок, поэтому другое его название —

Обработка на компьютере: критерий Я-Краскала-Уоллеса
Для обработки использованы данные примера 12.3. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Критерий %2-Фридмана (Friedman test) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для повторных измерений. Он позволяет проверять гипотезы о

Обработка на компьютере: критерий х2-Фридмана
Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor)в виде четырех переменных, соответствующих четырем сравниваемым услови

ОДНОФАКТОРНЫЙ ANOVA
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (средние значения, соответствующие разным градациям фактора, различ

Условие 122
Так зависит ли запоминание материала от условий его предъявления? Условие 1 Условие 2 Условие 3 №

Обработка на компьютере
Рассмотрим применение однофакторного ANOVA к данным примера 13.1 Исходные данные для анализа введены в таблицу (Data Editor)в следующем виде:

Descriptives VOSPR
Первая колонка — номера градаций фактора, вторая колонка (N) — численность выборок, Mean — средние значе

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA
В состав процедур ANOVA включаются множественные сравнения средних значений для разных уровней фактора: парные сравнения средних после отклонения H0(Post Hoc Tests); метод контрастов (C

Обработка на компьютере
Рассмотрим применение методов множественного сравнения с использованием данных примера 13.1. Применим метод Шеффе для парного сравнения средних и метод контрастов для сравнения третьего уровня фа

Scheffe
Fl N Subset for alpha = .05 1.00

N[(Mm-M)2 +(MB2-M)2+(MB3-M)2].