СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ

До сих пор под проверкой статистической гипотезы мы подразумевали про­цедуру определения надежности связи (р-уровня, как показателя статистичес­кой значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же ги­потеза верна: нулевая — об отсутствии связи или альтернативная — о ее нали­чии. Соответственно, от этого зависит и окончательный, содержательный вы­вод исследования: подтверждена или нет исходная научная гипотеза.

Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является /^-уровень — вероятность того, что вер­на все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверен­ностью можно отклонить Но в пользу Н], тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследо­вание проведено на выборке, а вывод делается в отношении генеральной со­вокупности. При отклонении Но в пользу Н, исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Но вовсе не исключает наличие связи. Рассмотрим возможные исходе! приня­тия решения в зависимости от действительного положения дел:

В действительности:

Решение н а н истинна

Неправильное решение, Правильное решение,
ошибка I рода, вероятность = 1 — р
вероятность = а (мощность или
  чувствительность критерия)
Правильное решение, Неправильное решение,
вероятность — 1 — а ошибка 11 рода,
(доверительная вероятность) вероятность = р

исследователя: ° '

Отклонить Н(1 (принять Н)

Принять Н

Как следует из таблицы, решение исследователя зависит от того, какую ве­роятность ошибки I рода а,он считает допустимой: если ^-уровень, получен­ный в процессе проверки гипотезы, меньше или равен а, исследователь отклоняет Но, и это, как правило, желательный для него результат (содержа­тельная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна а, точнее, равна /ьуровню. Если же /^-уровень превышает а, то принимается Но и содержательная гипотеза не под­тверждается1. Но при этом вероятность ошибки II рода f$— того, что верна все же Н] обычно остается неизвестной.

1 В угоду критически настроенному научному сообществу, но к огорчению исследователя!


ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ



Принятие Но: в угоду критически настроенно­му научному сообществу, но к огорчению исследователя


Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Но: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в гене­ральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положе­нию дел будет соответствовать свое, «альтернативное» теоретическое распре­деление, сходное с распределением для Но, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением а растет «доверительная вероятность» 1 — а, которая определяет величину отклонения выборочного среднего от А для принятия Н(); уменьшая а, исследователь увеличивает возможное отклоне­ние выборочного среднего от Л, при котором принимается Но. Принятие Но при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, р вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустить ошибку IIрода — не обнаружить различия или связи, которые на самом деле существуют.

Вероятность (1 —13) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Но, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным. Величина


Нп:

А В М

Рис. 7.3. Соотношение вероятностей ошибок [ и II рода



ГЛАВА 7- ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

(1 —а) характеризует степень доверия к результатам статистической провер­ки и называется доверительной вероятностью.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удов­летворяющее двум противоречивым требованиям. Величина а должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Но. Величина а должна быть достаточно велика, чтобы откло­нить Но при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного отве­та. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:

□ Для установленного значения а вероятность ошибки (3 уменьшается с
ростом объема выборки.

□ Вероятность ошибки (3 уменьшается при увеличении значения а (на­
пример, с 0,01 до 0,05).

Вопрос о величине а — вопрос о том, при каком же /7-уровне исследова­тель может отклонить Но, решается преимущественно исходя из неформаль­ных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из а = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Но признается уровень р < 0,05. Такая от­носительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Но целе­сообразно снизить до а = 0,01 и принимать решение о наличии связи (раз­личий) при р < 0,01.

Таблица 7.1 Традиционная интерпретация уровней значимости при а = 0,05

 

Уровень значимости Решение Возможный статистический вывод
р > 0,1 Принимается Но «Статистически достоверные разли­чия не обнаружены»
р<0,1 сомнения в истинности Н(), неопределенность «Различия обнаружены на уровне ста­тистической тенденции»
/?< 0,05 значимость, отклонение Н() «Обнаружены статистически досто­верные (значимые) различия»
р < 0,01 высокая значимость, откло­нение Но «Различия обнаружены на высоком уровне статистической значимости»



 



ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

НАПРАВЛЕННЫЕ И НЕНАПРАВЛЕННЫЕ АЛЬТЕРНАТИВЫ

Основная (нулевая) статистическая гипотеза, как отмечалось, содержит ут­верждение о равенстве нулю (коэффициента корреляции) или о равенстве сред­них значений, дисперсий и т. д. Если по результатам статистической проверки основная гипотеза отклоняется, то принимается альтернативная гипотеза. При­нимаемая альтернатива может быть как направленной(например, Н}: г > О или Н,: М1 > М2), так и не направленной(например, Н],1 г ^ 0 или Н,: Л/, ^ М2). То, какая альтернатива должна быть принята по результатам проверки, зависит от применяемого для проверки метода и теоретического распределения. Обычно характер альтернативы явно указывается при описании метода.

В большинстве случаев направленность или ненаправленность альтерна­тивы зависит от формы теоретического распределения. Если оно симметрич­но и включает отрицательные значения, то обычно применяются ненаправ­ленные альтернативы. Это относится к таким теоретическим распределениям, KaKZ-распределение (нормальное распределение), распределение f-Стьюден-та и т. д. Если распределение асимметрично и может принимать только поло­жительные значения, то применяются направленные альтернативы, напри­мер, при использовании критериев %2-Пирсона или /"-Фишера, хотя встречаются и исключения. Важно отметить, что выбор альтернативы — на­правленной или ненаправленной исключает произвол исследователя и обычно задается выбранным методом проверки гипотезы.

Если процедура проверки гипотезы Но подразумевает ненаправленную аль­тернативу, то критические области, соответствующие ее отклонению (приня­тию альтернативы), поровну распределяются по обоим «хвостам» распреде­ления (рис. 7.4). Чаще всего интервал принятия нулевой гипотезы (1 —а) при этом охватывает диапазон теоретических значений, симметричный относи­тельно нуля (вспомним Z-распределение). Поэтому такие критерии часто на­зывают двусторонними (2-tailed), имеющими «двахвоста» —для проверки не­направленных гипотез. Заметим, что в этом случае, если принят уровень а для решения об отклонении Но, существует два теоретических (критических) зна­чения: одно отсекает а/2 справа, а другое, отрицательное — а/2 слева. Если проверяется направленная гипотеза, то процедура проверки допускает при-


 
 


о t3 -t3 о и

а) б)

Рис.7.4. Различие направленной (а) и ненаправленной (б) альтернатив (для одного итого же эмпирического значения р-уровень в случае (б) в два раза больше, чем в случае (а))


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

нятие односторонней альтернативы (1-tailed) (например, Н^ г>0). В этом слу­чае, если принят уровень а для решения об отклонении Но, существует одно теоретическое (критическое) значение (для Н,: г>0 — положительное), и оно отсекает ровно а справа (или слева — в зависимости от направления альтерна­тивы). Очевидно, что односторонняя альтернатива более «лояльна» к откло­нению Но для одних и тех же выборочных результатов. При двусторонней аль­тернативе, по сравнению с односторонней, нулевая гипотеза отвергается при больших значениях силы связи (корреляции, различий средних и пр.).

Важно отметить, что принятие по результатам проверки гипотезы нена­правленной альтернативы вовсе не означает ограничение выводов лишь «не­направленными» суждениями типа: «средние различаются», «корреляция отличается от нуля». Как следует из предыдущих рассуждений, проверка не­направленной гипотезы является более «строгой» (при прочих равных усло­виях). Принятие ненаправленной (двусторонней) альтернативы позволяет сде­лать вывод о направлении связи в генеральной совокупности в соответствии с выборочными данными.

ПРИМЕР______________________________________________________________

При проверке статистической значимости коэффициентов корреляции обычно используются ненаправленные альтернативы (Но: г = 0 против Н^ г^ 0). Однако если Но отклоняется, например, при г-—0,34, то вывод не ограничивается конста­тацией отличия от нуля, а распространяется и на знак связи: «обнаружена статис­тически достоверная отрицательная корреляция».

Ранее отмечалось, что определение р-уровня значимости — чисто техни­ческая процедура, выполняемая компьютерной программой автоматически, а при расчетах «вручную» — по таблицам теоретических распределений (кри­тических значений). Тем не менее, полезно знать, что существует простое соотношение между /ьуровнями для направленных и ненаправленных аль­тернатив. Для одного и того же эмпирического значения критерия р-уровень зна­чимости для направленной альтернативы в 2 раза меньше р-уровня для нена­правленной альтернативы.

ПРИМЕР______________________________________________________________

Предположим, сравниваются две дисперсии. При использовании таблицы крити­ческих значений для критерия /^Фишера (для направленных альтернатив) (прило­жение 3) эмпирическое значение оказалось между критическими для р = 0,05 и /7 = 0,01. Следовательно, для направленной альтернативы р< 0,05. Однако при срав­нении двух дисперсий проверяется двусторонняя (ненаправленная) альтернатива, поэтому действительный уровень значимости в данном случае — р < 0,1.

Различие между направленной и ненаправленной альтернативами, кажется, еще более усложняет и без того непростую логику статистической проверки ги­потез. Однако в большинстве случаев выбор альтернативы не является пробле­мой для исследователя — он определен самим методом (критерием) статисти-


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

ческой проверки и исключает возможность произвола. То, какая альтернатива предполагается, указывается явным образом при описании метода проверки. При проверке гипотезы с помощью таблиц критических значений указывает­ся, для какой альтернативы приведены критические значения. А при исполь­зовании статистической компьютерной программы в результатах указывается, для какой альтернативы приведен /^-уровень значимости. Например, при обра­ботке в среде программы SPSS: Sig. (2-taiIed) —/^-уровень значимости (двусто­ронний), Sig. (I-tailed) — р-уровень значимости (односторонний).

СОДЕРЖАТЕЛЬНАЯ ИНТЕРПРЕТАЦИЯ СТАТИСТИЧЕСКОГО РЕШЕНИЯ

Статистическое решение является основанием для содержательного вывода в отношении проверяемой гипотезы. Но гарантирует ли отклонение Но истин­ность содержательной гипотезы о наличии связи или различий? Может ли при­нятие Но служить основанием для вывода об отсутствии связи или различий?

Принятие Но.Из обсуждения оснований принятия статистического реше­ния следует, что, когда принимается Но, всегда остается вероятность того, что связь или различия все же есть. И мы ничего не можем сказать о том, насколь­ко велика или мала эта вероятность.

Принятие Но не означает, что различия отсутствуют или мера связи равна нулю; из этого следует только то, что статистически значимые результаты не обнаружены.

Когда в результате исследования принимается Но, никакого содержательно­го вывода сделать нельзя. Поэтому выражение «Отрицательный результат ис­следования — тоже результат» имеет для исследователя исключительно пси­хотерапевтическое значение: отрицательный результат исследования — это отсутствие какого бы то ни было результата!

Отклонение Но.В этом случае остается вероятность того, что Но все-таки верна и эта вероятность равна/?-уровню значимости. Следовательно, нельзя утверждать, что результаты доказывают справедливость содержательной ги­потезы. Корректным будет более осторожный вывод о том, что получено сви­детельство в пользу содержательной гипотезы.

Не менее рискован содержательный вывод о причинно-следственной за­висимости между изучаемыми явлениями только на основании статистичес­кой значимости связи между соответствующими признаками. Конечно, ста­тистическая связь между признаками — это необходимое, но не достаточное условие причинно-следственной связи между ними. Утверждение о том, что явление А есть причина явления В, справедливо, если одновременно выпол­няются три условия (Д. Кэмпбелл, 1980): а) явления А и i?статистически свя­заны; б) А происходит раньше В; в) отсутствует альтернативная интерпрета-


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА


Альтернативная интерпретация статисти­чески достоверной связи между явлениями

ция появления В помимо А (другими словами — отсутствует обшая причина С совместной изменчивости А и В). Таким образом, применение статистичес­ких методов позволяет обосновать наличие только статистической связи — одного из трех признаков причинно-следственной связи.

Следует отметить, что при оформлении исследовательского отчета (курсо­вой или дипломной работы, публикации) статистические гипотезы и статисти­ческие решения, как правило, не приводятся. Обычно при описании результа­тов указывают критерий, приводят необходимые описательные статистики (средние, сигмы, корреляции и т. д.), эмпирические значения критериев, сте­пени свободы и обязательно — ^-уровень значимости. Затем формулируют со­держательный вывод в отношении проверяемой гипотезы с указанием (обыч­но — в виде неравенства) достигнутого или не достигнутого уровня значимости.

ПРИМЕРЫ___________________________________________

На трех разных выборках проверялась содержательная гипотеза о связи креатив­ности и тревожности. При расчете на компьютере корреляций Пирсона были по­лучены следующие результаты для каждой из трех выборок:

1. /•= 0,270; W-36;/? = 0,11.

2. /-=0,411; УУ = 28;р = 0,02.

3. r=0,270; /V=41;p=0,08.

Приведем примеры содержательных выводов для каждого случая:

1. Связь между креативностью и тревожностью не обнаружена (р > 0,1). Или: ста­
тистически значимой связи между креативностью и тревожностью не обнару­
жено > 0,1).

2. Обнаружена статистически значимая связь между креативностью и тревожнос­
тью < 0,05). Или: обнаружена статистически достоверная связь между креа­
тивностью и тревожностью (р < 0,05).

3. Связь между креативностью и тревожностью обнаружена лишь на уровне стати­
стической тенденции (р< 0,1).

В заключении главы отметим место статистического вывода в общей по­следовательности проверки содержательной гипотезы.

1. Формулировка содержательной гипотезы.

2. Планирование исследования (выборка, процедура, инструментарий...),
в том числе предварительная формулировка доступной проверке стати­
стической гипотезы.


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

3. Проведение измерений и накопление исходных данных.

4. Окончатдлытя формулировка статистической гипотезы, выбор статис­
тического критерия, установление величины ос — допустимой вероятно­
сти ошибки I рода.

5. Определение />-уровня статистической значимости в результате приме­
нения статистического критерия.

6. Статистический вывод: статистическое решение о принятии или откло­
нении Но.

7. Формулировка содержательного вывода.


Глава 8