Ранговая корреляция

 

Коэффициенты линейной корреляции Пирсона имеют своей теоретической предпосылкой нормальное или близкое к нему распре­деление переменных и их количественное выражение. При других Условиях возникает непараметрическая корреляция, в частности, ранговая корреляция, которая применяется в тех случаях, когда наблюдения неравноценны между собой или когда переменные (признаки) - качественные. Ранги бывают несвязными и связными - соответствен­но неповторяющимися и повторяющимися по наблюдениям , задаваясь субъективно или по специальным методикам.

Среди всех ранговых показателей важнейшими являются ран­говые коэффициенты парной линейной корреляции и английских статистиков-биометриков Ч. Спирмена (1863 - 1945) и М. Кендэла (род. 1907). В случае неповторяющихся (несвязных) рангов и для переменных и в их наблюдениях искомые ранговые коэффициенты равны:

 

а) ;

 

б) , (8)

 

где: - квадрат разности рангов и двух переменных х и y в наблюдении к;

- число рангов , превышающих данный ранг зависимой переменной у, при сравнении ее наблюдения k со всеми последующими наблюдениями для ;

- аналогичное число последующих рангов, не превы­шающих данный ранг ;

- сумма превышающих и не превышающих рангов.

Ранги и для и r обычно задаются целочисленными - от 1 до n и в зависимости от исходных значений переменных и : чем эти значения больше (меньше), тем выше (ниже) их ранги. Например, наименьшие значения х и y получают свои единичные , а наибольшие - свои максимальные ранги . В принципе возможна другая система ранжирования переменных по их наблюдениям.

Для многомерного случая наличия m переменных на основе определяется коэффициент линейной конкордации (экспертного со­гласия) Кендэла - коэффициент множественной ранговой корреляции, который в случае несвязных рангов имеет вид

 

. (9)

 

Случай связных (повторяющихся) рангов для показателей , , W здесь не рассматривается ввиду громоздкости математических вы­ражений и трудоемкости расчетов.

Значимость коэффициентов Спирмена и Кендэла оценивается по-разному. Значимость при проверяется по "Таблице зна­чимости коэффициентов Спирмена", которая разработана английски­ми биометриками Г. Т. Глиссером и Р. Ф. Винтером в 1961 г. и при­водится в редких русских источниках. Поэтому чаще всего использу­ется классический t-критерий Стьюдента путем расчета его фактиче­ского значения на основе среднеквадратической ошибки

 

. (10)

 

Если , то коэффициент статистически значим с за­данным уровнем значимости и имеющимися степенями свободы , а при - статистически незначим.

Значимость при оценивается аналогично (10), с учетом замены на и на .

При большом числе наблюдений, когда , значимость оценивается по нормальному закону, путем расчета на основе ошибки его порогового зна­чения :

 

; (11)

 

где - аргумент нормального закона (табулированной функции Лапласа-Шеппарда) при заданном уровне доверительной вероятности .

Если , то коэффициент статистически значим, а при - статистически незначим. Значимость W проверяется по - распределению Пирсона путем расчета его фактического значения

. (12)

 

При коэффициент W значим с уровнем значимости и числом степеней свободы , а при - незначим.

Все критерии (10) - (12) рассмотрены для случая несвязных рангов. Практически считается, что , , W являются значимыми, ко­гда они превышают число 0,5. В табл. 12.3 - 12.5 на условных данных проведен расчет коэффициентов для несвязных рангов с единым уровнем значимости .