КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Корреляционный анализ — это проверка гипотез о связях между переменны­ми с использованием коэффициентов корреляции. Наиболее распространен­ные коэффициенты корреляции подробно рассмотрены в главе 6. В этой гла­ве разбираются вопросы, непосредственно касающиеся проверки гипотез с применением коэффициентов корреляции.

Коэффициент корреляции — это мера прямой или обратной пропорциональ­ности между двумя переменными. Он чувствителен к связи только в том слу­чае, если эта связь является монотонной — не меняет направления по мере увеличения значений одной из переменных.

Основные показатели: сила, направление и надежность (достоверность) свя­зи. Сила связи определяется по абсолютной величине корреляции (меняется от 0 до 1). Направление связи определяется по знаку корреляции: положи­тельный — связь прямая; отрицательный — связь обратная. Надежность свя­зи определяется /^-уровнем статистической значимости (чем меньше р-уро-вень, тем выше статистическая значимость, достоверность связи).

Условия применения коэффициентов корреляции:

□ переменные измерены в количественной (ранговой, метрической) шкале
на одной и той же выборке объектов;

□ связь между переменными является монотонной.

Основная проверяемая статистическая гипотеза в отношении коэффици­ентов корреляции является ненаправленной и содержит утверждение о ра­венстве корреляции нулю в генеральной совокупности Но: гху — 0. При ее отклонении принимается альтернативная гипотеза Hj: rxy^0 о наличии поло­жительной (отрицательной) корреляции — в зависимости от знака выбороч­ного (вычисленного) коэффициента корреляции.

Содержательные выводы. Если по результатам статистической проверки Но: 7 = 0 не отклоняется на уровне а, то содержательный вывод: связь между х и у не обнаружена. Если Но: ?= О отклоняется на уровне а, то содержательный вывод: обнаружена положительная (отрицательная) связь между х и у.

Что влияет на р-уровень значимости корреляции ? Статистическая значимость коэффициента корреляции тем выше (р-уровень меньше), чем больше его аб-


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

солютная величина (при одном и том же объеме выборки) и чем больше объем выборки (при одном и том же значении корреляции). При большой числен­ности выборки даже слабые связи могут достигать статистической значимости.

Например, для одного и того же значения гху = 0,200, если N < 90, то р > 0,05 — корреляция статистически не значима; а если N> 100, тор< 0,05 — связь статисти­чески достоверна.

Величина корреляции не всегда отражает силу связи. Соответственно, /^-уро­вень значимости не всегда отражает надежность связи. Наиболее распростра­ненные причины — «выбросы», «ложные» корреляции, нелинейные связи (см. раздел главы 6 «Величина корреляции и сила связи»).

КОРРЕЛЯЦИЯ МЕТРИЧЕСКИХ ПЕРЕМЕННЫХ

Статистическая гипотеза о связи двух метрических переменных проверя­ется в отношении коэффициента корреляции /--Пирсона, который вычисля­ется по формуле:


xay

Основной (нулевой) статистической гипотезой является равенство г-Пир-сона нулю в генеральной совокупности (Но: rvv = 0). Определение /?-уровня значимости осуществляется при помощи критерия ?-Стьюдента:



(10.1)


С целью упрощения проверки при обработке данных «вручную» обычно пользуются таблицами критических значений гху, которые составлены с помо­щью этого критерия (приложение 6). При вычислениях на компьютере стати­стическая программа (SPSS, Statistica) сопровождает вычисленный коэффи­циент корреляции более точным значением р-уровня.

Для статистического решения о принятии или отклонении Но обычно ус­танавливают а = 0,05, а для выборок большого объема (около 100 и более) а = 0,01. Если р < а, Но отклоняется и делается содержательный вывод о том, что обнаружена статистически достоверная (значимая) связь между изучае­мыми переменными (положительная или отрицательная — в зависимости от знака корреляции). Когда р >а, Но не отклоняется, и содержательный вывод ограничен констатацией того, что связь (статистически достоверная) не об­наружена.


ГЛАВА 10. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ