График рассеяния

Силу корреляции можно обнаружить, рассмотрев график рассеяния. Он является графическим отображением взаимосвязи, на которую указывает корреляция. В случае полной положительной или полной отрицательной корреляции точки образуют прямую линию, а нулевая корреляция дает график рассеяния типа (а), точки которого распределены случайным образом. По сравнению с умеренной корреляцией (г и д) точки сильной расположены ближе друг к другу (б и в). В целом, по мере ослабления корреляции точки на графике рассеяния все больше удаляются от диагонали, связывающей точки при полной кор

       
   
 

реляции, равной +1,00 или -1,00.


a) r = 0 б) r = -0.9 в) r = +0.9

 

       
   

г) r = - 0.56 д) r = +0.61

Рассмотренные выше графики рассеяния (кроме а) апроксмировались прямыми линиями, то есть отражали линейные зависимости. Однако не все взаимосвязи линейны, а вычисление r Пирсона для нелинейного случая не поможет выявить природу такой взаимосвязи. На следующем рисунке показан гипотетический пример связи между возбуждением и выполнением задания, илюстрирующий закон Йеркса-Додсона: сложные задания выполняются хорошо при среднем уровне возбуждения, но плохо при очень низком и очень высоком. Из графика рассеяния видно, что точки ложатся вдоль определенной кривой, но при попытке применить линейную корреляцию мы получим r, близкий к нулю.

При проведении корреляционного исследования важно учитывать людей, оценки которых попадают в широкий диапазон. Ограничение диапазона одной или обеих переменных снижает корреляцию. Предположим, мы изучаем взаимосвязь между средним баллом школьного аттестата и успеваемостью в ВУЗе (оценивается по средним баллам, полученным первокурсниками в конце года). На рис. а) показано, каким может быть график рассеяния при исследовании 25 студентов. Коэффициент корреляции равен +0,87. Но если изучить эту взаимо
связь на примере студентов, получивших средний бал в школе 4,5 и выше,

 
 

то корреляция изменится, она падает до +0,27.

а) r = 0.87 б) r = 0,27

 

Коэффициент детерминации – г2

Важно иметь в виду, что довольно легко неверно понять смысл конкретного значения пирсонова г. Если оно равняется +0,70, то взаимосвязь действительно является относительно сильной, но не надо думать, что +0,70 каким-то образом связано с 70%, и в таком случае взаимосвязь установлена на 70%. Это неверно. Для интерпретации значения корреляции следует использовать коэффициент детерминации (г2). Он находится возведением в квадрат г, а поэтому его значение никогда не бывает отрицательным. Данный коэффициент формально определяется как степень изменчивости одной переменной корреляции, вызванная изменчивостью другой переменной. Поясним это на конкретном примере.

Проводится исследование, в ходе которого у 100 участников измеряется уровень эмоциональной депрессии и средний балл. Мы проверяем взаимосвязь между двумя переменными и обнаруживаем отрицательную корреляцию: чем выше уровень депрессии, тем ниже средний балл, и наоборот, чем слабее депрессия тем выше средний балл. Рассмотрим два значения корреляции, которые могут быть получены в результате этого исследования, – -1,00 и -0,50. Коэффициент детерминации будет равен 1,00 и 0,25 соответственно. Чтобы понять смысл этих значений, для начала обратим внимание на то, что средний балл у 100 изучаемых людей, скорее всего, будет варьироваться от 3,0 до 5,0. Как исследователи, мы хотим выяснить причину такой изменчивости – почему один человек получает 3,2 балла, а другой 4,4 и т. д. Другими словами, мы хотим узнать, что вызывает индивидуальные различия в средних баллах? В действительности, причиной этому может быть несколько факторов: учебные привычки, общий уровень интеллекта, эмоциональная устойчивость, склонность к выбору легких предметов для изучения и т. д. Как показывают оценки теста на депрессию, в нашем гипотетическом исследовании изучается один из этих факторов — эмоциональная устойчивость, г2 показывает, насколько изменчивость средних баллов может быть связана непосредственно с депрессией. В первом случае, когда г = -1,00, а г2 = 1,00, мы можем прийти к выводу, что 100% изменчивости средних баллов связана с изменчивостью оценок депрессии. Следовательно, можно сказать, что 100% различий между средними баллами (3,2 и 4,4 и др.) вызваны депрессией. В реальном исследовании такой результат, конечно, невозможно получить. Во втором случае, когда г = -0,5, а г2 = 0,25, только одна четверть (25%) изменчивости средних баллов будет связана с депрессией. Остальные 75% связаны с другими факторами, подобными перечисленным выше. Говоря кратко, коэффициент детерминации лучше характеризует силу отношений, чем г Пирсона.