Коэффициенты линейной корреляции Пирсона имеют своей теоретической предпосылкой нормальное или близкое к нему распределение переменных и их количественное выражение. При других Условиях возникает непараметрическая корреляция, в частности, ранговая корреляция, которая применяется в тех случаях, когда наблюдения неравноценны между собой или когда переменные (признаки) - качественные. Ранги бывают несвязными и связными - соответственно неповторяющимися и повторяющимися по наблюдениям , задаваясь субъективно или по специальным методикам.
Среди всех ранговых показателей важнейшими являются ранговые коэффициенты парной линейной корреляции и английских статистиков-биометриков Ч. Спирмена (1863 - 1945) и М. Кендэла (род. 1907). В случае неповторяющихся (несвязных) рангов и для переменных и в их наблюдениях искомые ранговые коэффициенты равны:
а) ;
б) , (8)
где: - квадрат разности рангов и двух переменных х и y в наблюдении к;
- число рангов , превышающих данный ранг зависимой переменной у, при сравнении ее наблюдения k со всеми последующими наблюдениями для ;
- аналогичное число последующих рангов, не превышающих данный ранг ;
- сумма превышающих и не превышающих рангов.
Ранги и для и r обычно задаются целочисленными - от 1 до n и в зависимости от исходных значений переменных и : чем эти значения больше (меньше), тем выше (ниже) их ранги. Например, наименьшие значения х и y получают свои единичные , а наибольшие - свои максимальные ранги . В принципе возможна другая система ранжирования переменных по их наблюдениям.
Для многомерного случая наличия m переменных на основе определяется коэффициент линейной конкордации (экспертного согласия) Кендэла - коэффициент множественной ранговой корреляции, который в случае несвязных рангов имеет вид
. (9)
Случай связных (повторяющихся) рангов для показателей , , W здесь не рассматривается ввиду громоздкости математических выражений и трудоемкости расчетов.
Значимость коэффициентов Спирмена и Кендэла оценивается по-разному. Значимость при проверяется по "Таблице значимости коэффициентов Спирмена", которая разработана английскими биометриками Г. Т. Глиссером и Р. Ф. Винтером в 1961 г. и приводится в редких русских источниках. Поэтому чаще всего используется классический t-критерий Стьюдента путем расчета его фактического значения на основе среднеквадратической ошибки
. (10)
Если , то коэффициент статистически значим с заданным уровнем значимости и имеющимися степенями свободы , а при - статистически незначим.
Значимость при оценивается аналогично (10), с учетом замены на и на .
При большом числе наблюдений, когда , значимость оценивается по нормальному закону, путем расчета на основе ошибки его порогового значения :
; (11)
где - аргумент нормального закона (табулированной функции Лапласа-Шеппарда) при заданном уровне доверительной вероятности .
Если , то коэффициент статистически значим, а при - статистически незначим. Значимость W проверяется по - распределению Пирсона путем расчета его фактического значения
. (12)
При коэффициент W значим с уровнем значимости и числом степеней свободы , а при - незначим.
Все критерии (10) - (12) рассмотрены для случая несвязных рангов. Практически считается, что , , W являются значимыми, когда они превышают число 0,5. В табл. 12.3 - 12.5 на условных данных проведен расчет коэффициентов для несвязных рангов с единым уровнем значимости .