Реферат Курсовая Конспект
УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Статистическая Значимость(Significant Level, Сокращен...
|
Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статистической гипотезы. Говоря техническим языком, это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статис-
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
тическая значимость, р-уровень значимости является количественной оценкой надежности связи: чем меньше эта вероятность, тем надежнее связь.
Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности показала, что если она верна, то вероятность случайного появления обнаруженных различий составляет не более 5%. Иначе говоря, если бы две выборки многократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средними этих выборок. То есть существует 5%-ная вероятность того, что обнаруженные различия носят случайный характер, а не являются свойством совокупности.
В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой гипотезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.
Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:
□ величина связи (различия) больше;
□ изменчивость признака (признаков) меньше;
□ объем выборки (выборок) больше.
Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназначенные для соотнесения эмпирических значений статистик с теоретическими распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при увеличении объема выборки.
Чем больше гипотез проверяется, тем выше шанс получить результат чисто случайно — р-уровень увеличивается пропорционально количеству проверяемых гипотез!
Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентичной) выборке.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ
Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
упомянули критерий ^-Стьюдента. Как следует из логики проверки статистических гипотез, в качестве основы для применения статистических критериев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим распределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследователь вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.
Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы(degrees of freedom — обозначается как df)— это количество возможных направлений изменчивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти показатели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следующее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.
Назначение критерия— проверка статистической гипотезы путем определения/ьуровня значимости (вероятности того, что Но верна).
Выбор критерияопределяется проверяемой статистической гипотезой.
Критерий включает в себя:
Пформулу расчета эмпирического значения критерия по выборочным статистикам; D правило (формулу) определения числа степеней свободы;
□ теоретическое распределение для данного числа степеней свободы;
□ правило соотнесения эмпирического значения критерия с теоретичес
ким распределением для определения вероятности того, что Но верна.
Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать разные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообразия: вычисленное по формуле эмпирическое значение критерия сопоставляется с теоретическим распределением для заданного числа степеней свободы, что позволяет определить вероятность того, что Но верна.
ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ
Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
V |
Выбор критерия представляет собой отдельную проблему
будет рассматриваться нами в следующей главе. А сейчас будем исходить из того, что исследователь уже решил проблему выбора критерия, и рассмотрим общую последовательность проверки гипотезы.
При обработке данных на компьютере при помощи статистической программы (например, SPSS) исследователю достаточно указать программе, какой критерий (метод, тест) необходимо применить к заданной выборке исходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве результата исследователь получает значение ^-уровня значимости, наряду с эмпирическим значением критерия и числом степеней свободы.
Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:
1. Выбор критерия в зависимости от вида исходных данных и статистичес
кой гипотезы: теоретического распределения, формул расчета эмпири
ческого значения критерия и числа степеней свободы.
2. Расчет по исходным данным (или по имеющимся статистикам) эмпи
рического значения критерия и числа степеней свободы.
3. Применение «Таблицы критических значений критерия» позволяет оп
ределить значение /?-уровня для данного числа степеней свободы.
Таблица критических значенийсодержит значения (квантили) теоретического распределения, соответствующие наиболее важным — критическим значениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. /7-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и/?-уровни, им соответствующие. Далее значение р-уровня определяется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием /ьуровня):
П если эмпирическое значение критерия (Кэ) находится между двумя критическими значениями, то /^-уровень меньше того критического р, которое находится левее;
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;
О если Кэ находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.
Например, если эмпирическое значение критерия (Кэ) находится между А^05 и А'оо,, то р < 0,05. Если Кэ находится левее ЛГО>Ь то р > 0,1. Если А^ находится правее АоОП,, тор < 0,001.
Решение исследователя:
р>0,1 р<0,1 р<0,05 р < 0,01 р< 0,001
Рис. 7.2. Схема определения/^-уровня (р~ ... — критические значения/ьуровня, К — соответствующие критические значения критерия)
Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, у} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше/^-уровень). Но для некоторых критериев зависимость обратная. Например, £/-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения ^-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если t3 находится между /0, и г005 (т. е. /0,i < t3< tQ$5), тор < 0,1. И если 1/э находится между UQl и £/о,о5 (т.е- ^о,о5 < &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/э < tQ>ь но С/э > Uo^), то уровень значимости определяется как/j > 0,1.
ПРИМЕРЫ_____________________________________________________________
1. Гипотеза Но: М -100 проверяется при помощи критерия /-Стьюдента. Для вы
числения эмпирического значения критерия t3 применяется формула 7.2. На
выборке vV= 36 получены следующие значения статистик: М= 107,5, о = 15. По
формуле 7.2 t3- 3, df= 35. Далее воспользуемся таблицей критических значений
/-Стьюдента (приложение 2). В этой таблице строки соответствуют df— числам
степеней свободы, столбцы — критическим значениям р-уровня. В строке для
df— 35 обнаруживаем, что наше эмпирическое значение попадает в интервал
между значениями 2,724 (для р - 0,01) и 3,591 (для р ~ 0,001). Следовательно,
вероятность того, что Но верна, р < 0,01.
2. Предположим, та же гипотеза проверяется на выборке N — 36, но получены сле
дующие значения статистик: М= 102,5, а— 15. По формуле 1Э=, df= 35. Вос
пользовавшись той же таблицей критических значений, обнаруживаем, что
наше эмпирическое значение меньше, чем /Oil = 1,69. Следовательно, в соответ
ствии со схемой на рис. 7.2, р > 0,1.
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
– Конец работы –
Эта тема принадлежит разделу:
ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов