Корреляционный анализ — это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Наиболее распространенные коэффициенты корреляции подробно рассмотрены в главе 6. В этой главе разбираются вопросы, непосредственно касающиеся проверки гипотез с применением коэффициентов корреляции.
Коэффициент корреляции — это мера прямой или обратной пропорциональности между двумя переменными. Он чувствителен к связи только в том случае, если эта связь является монотонной — не меняет направления по мере увеличения значений одной из переменных.
Основные показатели: сила, направление и надежность (достоверность) связи. Сила связи определяется по абсолютной величине корреляции (меняется от 0 до 1). Направление связи определяется по знаку корреляции: положительный — связь прямая; отрицательный — связь обратная. Надежность связи определяется /^-уровнем статистической значимости (чем меньше р-уро-вень, тем выше статистическая значимость, достоверность связи).
Условия применения коэффициентов корреляции:
□ переменные измерены в количественной (ранговой, метрической) шкале
на одной и той же выборке объектов;
□ связь между переменными является монотонной.
Основная проверяемая статистическая гипотеза в отношении коэффициентов корреляции является ненаправленной и содержит утверждение о равенстве корреляции нулю в генеральной совокупности Но: гху — 0. При ее отклонении принимается альтернативная гипотеза Hj: rxy^0 о наличии положительной (отрицательной) корреляции — в зависимости от знака выборочного (вычисленного) коэффициента корреляции.
Содержательные выводы. Если по результатам статистической проверки Но: 7 = 0 не отклоняется на уровне а, то содержательный вывод: связь между х и у не обнаружена. Если Но: ?= О отклоняется на уровне а, то содержательный вывод: обнаружена положительная (отрицательная) связь между х и у.
Что влияет на р-уровень значимости корреляции ? Статистическая значимость коэффициента корреляции тем выше (р-уровень меньше), чем больше его аб-
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
солютная величина (при одном и том же объеме выборки) и чем больше объем выборки (при одном и том же значении корреляции). При большой численности выборки даже слабые связи могут достигать статистической значимости.
Например, для одного и того же значения гху = 0,200, если N < 90, то р > 0,05 — корреляция статистически не значима; а если N> 100, тор< 0,05 — связь статистически достоверна.
Величина корреляции не всегда отражает силу связи. Соответственно, /^-уровень значимости не всегда отражает надежность связи. Наиболее распространенные причины — «выбросы», «ложные» корреляции, нелинейные связи (см. раздел главы 6 «Величина корреляции и сила связи»).
КОРРЕЛЯЦИЯ МЕТРИЧЕСКИХ ПЕРЕМЕННЫХ
Статистическая гипотеза о связи двух метрических переменных проверяется в отношении коэффициента корреляции /--Пирсона, который вычисляется по формуле:
xay
Основной (нулевой) статистической гипотезой является равенство г-Пир-сона нулю в генеральной совокупности (Но: rvv = 0). Определение /?-уровня значимости осуществляется при помощи критерия ?-Стьюдента:
(10.1)
С целью упрощения проверки при обработке данных «вручную» обычно пользуются таблицами критических значений гху, которые составлены с помощью этого критерия (приложение 6). При вычислениях на компьютере статистическая программа (SPSS, Statistica) сопровождает вычисленный коэффициент корреляции более точным значением р-уровня.
Для статистического решения о принятии или отклонении Но обычно устанавливают а = 0,05, а для выборок большого объема (около 100 и более) а = 0,01. Если р < а, Но отклоняется и делается содержательный вывод о том, что обнаружена статистически достоверная (значимая) связь между изучаемыми переменными (положительная или отрицательная — в зависимости от знака корреляции). Когда р >а, Но не отклоняется, и содержательный вывод ограничен констатацией того, что связь (статистически достоверная) не обнаружена.
ГЛАВА 10. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ