Семинар N 10

Коэффициент корреляции φ.

 

Коэффициент корреляции φ устанавливает взаимосвязь между двумя переменными, которые обладают дихотоническими признаками.

Дихотомия – противопоставление.

 

Например: 0 – отсутствие, 1 – наличие признака.

 

Задача:

Влияет ли семейное положение на успешность учёбы студентов мужчин. Психолог опросил 12 студентов-мужчин об их семейном положении (0 = холост, 1 = женат) и об успешности обучения (0 = наличие академических задолженностей, 1 = успешное обучение).

 

N п/п Семейное положение Успешность обучения N п/п Семейное положение Успешность обучения

 

Обозначим семейное положение переменной x, а успешность обучения переменной y.

Формула для расчёта коэффициента корреляции φ:

φ = pxy – px * py

px (1-px) * py (1-py) (знаменатель под корнем)

 

px – частота или доля признака имеющего 1 по переменной x.

1 - px – частота или доля признака, имеющего 0 по x.

py – частота или доля признака имеющего 1 по переменной y.

1 – py – частота или доля признака имеющего 0 по y.

pxy – частота или доля признака имеющая 1 одновременно по x и по y.

 

Для вычисления частот подсчитывают количество единиц в переменной х. Полученную величину делят на N.

N – это общее число элементов переменной.

 

В нашей задаче N = 12.

Аналогично подсчитывают количество единиц в переменной “y” и делят на N.

 

Доля студентов имеющих 1 по x.

px = 5 = 0,4167

(1 – px) = 0,5833

 

Доля студентов имеющих 1 по y.

 

py = 5

 

(1 – py) = 0,5.

 

pxy – доля студентов, имеющих 1 по x и по y = 4 = 0,3333

φ = . 0,3333 – 0,4167 * 0,5 = . 0,12455 = 0,507

0,4167 * 0,5833 * 0,5 * 0,5 (знаменатель под корнем) 0,24650

 

Для коэффициента корреляций φ не существует таблицы критических значений. Критические значения φ вычисляются по формуле:

 

φкрит = |r| * n - 2 (вся дробь под корнем)

1 – r2

r – коэффициент корреляции.

n – число коррелируемых признаков.

0,507 * _12 – 2__ (дробь под корнем) = 1,86

1 – 0,5072

 

Вычисление критического значения проверяется по таблице t-критерия Стьюдента. Для этого определяют количество степеней свободы по формуле:

 

df = n-2 (то есть у нас 12-2 = 10 степеней свободы)

 

p<0,05 если t-критерий больше, чем 2,228.

 

Поскольку вычисленное критическое значение меньше табличного, значит, на уровне значимости p < 0,5 мы отклоняем альтернативную гипотезу n1 и принимаем нулевую гипотезу n0. Это значит, что успешность обучения не различается в зависимости от семейного положения.

Между успешностью обучения и семейным положением никакой связи нет.

 

Критерий Немени.

Этот критерий основан на ранжировании всей выборки. Если в выборке K групп по n элементов, то наименьшему наблюдению приписывается ранг «1» и так далее.

 

Затем суммируются ранги в каждой группе и вычисляются значения разностей сумм рангов.

 

Критерий Немени позволяет оценивать различия средних значений между группами. При этом группы должны быть равны по величине. Количество групп должно быть не меньше 4, но не больше 10.

 

Задача:

Проводим обследование 4х групп спортсменов высокой квалификации по 5 человек в группе: 1 – футболисты, 2 – гимнасты, 3 – теннисисты, 4 – пловцы. Изучалось время реакции выбора в миллисекундах (мс).

Регулируемый фактор – спортивная специализация. Результирующий признак – длительность времени реакции.

 

 

1 ранг 2 ранг 3 ранг 4 ранг
балл ранг балл ранг балл ранг балл ранг
7,5
7,5
  55,5   70,5    

 

Проверим правильность ранжирования. Для этого сложим: 55,5 + 70,5 + 51 + 33 = 210.

И по формуле

k*c (k*c + 1)

 

k – число строк.

c – число столбцов.

 

20 * 21 = 210.

 

Результаты совпадают. Всё верно. Найдём разности сумм рангов.

 

Разности рангов 1-2 1-3 1-4
2-3 |55,5 – 70,5|= 15 |55,5 - 51| = 4,3 |55,5 - 33| = 22,5
2-4   |70,5 - 51| = 19,5 |70,5 -33| = 37,5
3-4     |57 - 33| = 18

 

p< 0,05 если D<48,1

 

По таблице критических значений мы находим, что при k = 4, а n = 5 (k – число строк).

p < 0,05 если критерий Немени больше 48,1.

Все разности у нас меньше критических значений. Следовательно мы принимаем нулевую гипотезу h0 и утверждаем, что различие во времени реакции между группами спортсменов оказались случайными.

Тип спортивной специализации на эти значения не влияет.

 

Тест 5. 18.04

1. г)

2. д)

3. г)

4. д)

5. д)

6. в)

7. г)

8. в)

9. г)

10. в)

11. а)

12. в)

13. б)

14. а)

15. б)

16. б)

17. г)

18. г)

19. в)

20. г)

21. г)